Những điều Google chưa thể tìm trên Internet
Google không chỉ là tên gọi của một công ty, một dịch vụ mà còn có nghĩa "tra cứu thông tin trên mạng kết nối toàn cầu", tuy nhiên vẫn có nhiều dữ liệu online hiện vượt qua tầm khả năng "săn tìm" của họ.
Nếu người dùng đăng ảnh lên web và đánh dấu, gắn thẻ (tag) cho chúng, Goolge sẽ dễ dàng tìm và hiển thị trong kết quả tìm kiếm. Tuy nhiên, nếu họ chỉ lấy ảnh lưu trong điện thoại, camera... rồi đưa lên mạng mà không đổi tên, không bổ sung dữ liệu phụ mô tả nội dung ảnh (metadata), Google sẽ lúng túng giữa một rừng ảnh có tên vô nghĩa như IMG_1234, DSC_100... Hãng tìm kiếm Mỹ đang tập trung phát triển công cụ nhận diện khuôn mặt để phân biệt sự khác nhau giữa ảnh của tổng thống Mỹ Barack Obama và George Bush kể cả khi hai file có cùng tên gọi.
Ngoài ra, nếu mọi người ghi âm giọng nói và đăng trên Internet, họ có thể chẳng bao giờ tìm ra nó từ công cụ tìm kiếm trừ khi file đó đã được chú thích bằng một số từ ngữ dạng text nhất định. Nhận dạng giọng nói đang đóng vai trò ngày một quan trọng khi mà con người bắt đầu trò chuyện qua máy tính nhiều hơn là gõ chữ.
Google cũng "bó tay" trong việc hiểu nội dung của những file được scan (quét) từ sách báo. Các tệp tin lưu theo định dạng PDF chỉ được tìm thấy nếu người dùng đặt tên rõ ràng hoặc gắn thẻ cho chúng.
Theo VnExpress










