Google Lens sẽ sớm cho phép tìm kiếm theo ảnh và văn bản kết hợp

Google Lens, công nghệ nhận dạng hình ảnh mới, sẽ sớm cho phép máy ảnh của điện thoại thông minh không chỉ nhận dạng các vật thể trong thế giới thực mà còn được kết hợp với các cụm từ tìm kiếm để cho phép người dùng tìm theo hình ảnh mà họ muốn.

 

Google sẽ bổ sung thêm chức năng từ Mô Hình Hợp Nhất Đa Nhiệm (MUM) để cho phép hệ thống Lens nhận biết thông tin từ cả dữ liệu hình ảnh cũng như đầu vào văn bản, giúp mở rộng đáng kể các chức năng nâng cao.

MUM đã được ra mắt tại hội nghị nhà phát triển I/O của Google vào đầu năm nay. Theo báo cáo từ TechCrunch, MUM được xây dựng để cho phép các công nghệ của Google hiểu thông tin từ nhiều định dạng đồng thời. Mọi thứ từ văn bản, hình ảnh và video đều có thể được vẽ cùng nhau để kết nối với các chủ đề, khái niệm và ý tưởng. Khi nó được công bố, đó là một ý tưởng rộng lớn về các khả năng, nhưng bây giờ MUM đang tiến vào một ứng dụng thực tế hữu hình hơn khi kết hợp với Google Lens.

Google nói rằng họ sẽ sử dụng MUM để nâng cấp Google Lens với khả năng thêm văn bản vào các tìm kiếm trực quan để người dùng có thể cung cấp thêm ngữ cảnh và đặt câu hỏi về một cảnh để giúp Google cung cấp nhiều kết quả đúng mục tiêu cần tìm hơn.

Quá trình này có thể làm cho việc tìm kiếm một mẫu hoặc một mẫu quần áo dễ dàng hơn nhiều như được minh họa trong một ví dụ do công ty cung cấp. Ý tưởng là người dùng có thể kéo lên ảnh một mẫu quần áo trong Google Search, sau đó người dùng có thể nhấn vào biểu tượng Lens để yêu cầu Google tìm cùng một kiểu mẫu, nhưng trên dữ liệu về quần áo khác.

 


Như TechCrunch giải thích, bằng cách nhập một yêu cầu nào đó như “tất/vớ có họa tiết này”, người dùng có thể yêu cầu Google tìm các kết quả phù hợp hơn so với việc họ chỉ tìm kiếm dựa trên hình ảnh hoặc văn bản. Trong trường hợp này, gần như không thể chỉ sử dụng từ ngữ để tạo ra kết quả tìm kiếm mong muốn và bản thân bức ảnh cũng sẽ không có đủ ngữ cảnh.

Google cũng cung cấp ví dụ thứ hai. Nếu người dùng đang cố gắng tìm một phụ kiện để sửa chữa cho chiếc xe đạp bị hỏng của mình, nhưng họ không biết bộ phận bị hỏng được gọi là gì, Google Lens được cung cấp bởi MUM sẽ cho phép người dùng chụp ảnh bộ phận đó và thêm truy vấn “ cách khắc phục” đối với nó, có thể kết nối người dùng với thời điểm chính xác trong video sửa chữa sẽ trả lời câu hỏi.

 

Google tin rằng công nghệ này sẽ lấp đầy khoảng trống rất cần thiết về cách các dịch vụ của họ tương tác với người dùng. Thông thường, có một thành phần của truy vấn chỉ có thể được thể hiện đầy đủ bằng trực quan nhưng rất khó mô tả nếu không có khả năng thu hẹp kết quả tìm kiếm bằng văn bản.

Công ty cho biết họ hy vọng sẽ đưa MUM hoạt động trên các dịch vụ khác của Google trong tương lai. Bản cập nhật Google Lens MUM dự kiến ​​sẽ ra mắt trong vài tháng tới, nhưng không có tiến trình cụ thể nào được thông báo vì công ty vẫn cần thử nghiệm và đánh giá bổ sung trước khi ra mắt công khai.

 

Theo Petapixel

Related Articles