Google phát hành nghiên cứu thuật toán mới

20/11/13
367
142
43
#1
Google Research vừa phát hành một bài nghiên cứu thuật toán mới để trả lời các truy vấn. Nếu trong tương lai thuật toán này được đưa vào sẽ tiếp tục thay đổi các yếu tố xếp hạng truyền thống để xác định những gì được xếp hạng. Nghiên cứu này cung cấp thông tin chi tiết của Google khi họ nói rằng bản cập nhật thuật toán đã được thực hiện để cải thiện mức độ liên quan.

Google phat hanh nghien cuu thuat toan moi.png

Google phat hanh nghien cuu thuat toan moi 2.jpg

Thuật toán mới bằng tiếng Anh

Google Research đã xuất bản một bài viết mới tại Sixth International Conference trên Learning Representations. Ấn phẩm được công bố thông qua Twitter.

Bài viết có tiêu đề: Active Question Reformulation with Reinforcement Learning (PDF).

Bài viết thảo luận về cách thức cải tạo các truy vấn sau đó hiển thị các truy vấn đó đến một công cụ xếp hạng. Việc cải cách truy vấn và khởi tạo đã được sử dụng tại Google. Đây là hình thức của cách tiếp cận đó.

Đây là thuật toán machine learning sử dụng phương pháp Reinforcement Learning (hay còn gọi là học tăng cường). Hơn nữa, thuật toán không có hiểu biết về cách thức hoạt động của hệ thống xếp hạng. Thuật toán mới này sử dụng một hệ thống học tập để cải thiện truy vấn người dùng, yêu cầu nhiều câu hỏi xếp hạng, sau đó chọn câu trả lời hay nhất từ nhiều câu trả lời.

Thuật toán này hoạt động như thế nào

Dưới đây là một ảnh chụp màn hình minh họa từ bài nghiên cứ cách thuật toán machine learning (hay còn gọi là Máy học) này hoạt động:
Google phat hanh nghien cuu thuat toan moi 3.png

Người dùng đặt câu hỏi. Thuật toán machine learning (được gọi là tác nhân) cải tiến câu hỏi đó thành nhiều câu hỏi rồi submit chúng tới thuật toán xếp hạng. Thuật toán xếp hạng trả về tập các kết quả và tác nhân chọn câu trả lời tốt nhất.

Đây là những gì tài liệu nghiên cứu nói:

"Khi đối mặt với nhu cầu thông tin phức tạp, con người vượt qua sự không chắc chắn bằng cách cải tìm kiếm các câu hỏi, thực hiện nhiều tìm kiếm và tổng hợp các câu trả lời. Lấy cảm hứng từ khả năng của con người để đặt đúng câu hỏi, chúng tôi trình bày một tác nhân học cách thực hiện quy trình này cho người dùng. Tác nhân giữa người dùng và hệ thống QA backend mà chúng tôi gọi là "môi trường".
Chúng tôi gọi đó là tác nhân AQA vì nó thực hiện một chiến lược trả lời câu hỏi. AQA nhằm mục đích tối đa hóa cơ hội nhận được câu trả lời đúng bằng cách gửi một câu hỏi được cải cách tới môi trường.
Tác nhân tìm cách tìm câu trả lời tốt nhất bằng cách hỏi nhiều câu hỏi và tổng hợp các bằng chứng được trả về. Bên trong môi trường không có sẵn các tác nhân, do vậy nó phải học để thăm dò một hộp đen tối ưu chỉ sử dụng các chuỗi câu hỏi".

Tại sao thuật toán này lại là một vấn đề

Thuật toán này nhìn vào một phương pháp machine learning được gọi là Reinforcement Learning. Thuật toán Reinforcement Learning được sử dụng để tìm hiểu cách chơi Go và có thể chơi các trò chơi video như Doom.

Thuật toán đặc biệt này rất thú vị đối với SEO vì nó cho thấy cách một thuật toán có thể ngồi giữa người dùng và thuật toán xếp hạng thông thường và đưa ra quyết định. Do vậy, thay vì thuật toán xếp hạng quyết định những gì được hiển thị trong các trang kết quả tìm kiếm (SERPs) thì thuật toán machine learning này lại đưa ra quyết định.

Loại xếp hạng này là sự khởi đầu từ cách cộng đồng SEO theo truyền thống tin rằng công cụ tìm kiếm xếp hạng các trang web. Sự hiểu biết truyền thống là các yếu tố xếp hạng như liên kết, văn bản trong thẻ title, anchor text và các yếu tố xếp hạng khác là yếu tố quyết định những gì được xếp hạng từ thứ 1 đến thứ 10 trong kết quả tìm kiếm.

Các yếu tố như liên kết là một yếu tố xếp hạng quan trọng. Nhưng với loại thuật toán này, các liên kết đóng góp vào những webpage sẽ được xem xét để xếp hạng nhưng không phải là yếu tố quyết định.

Đó là công việc của một thuật toán khác có tập các trang đó và quyết định xem trang nào trả lời câu hỏi tốt nhất.

Bạn đã từng nhìn thấy một webpage có ít liên kết hơn được xếp hạng trên các trang có nhiều liên kết? Có thể có một thuật toán giữa người dùng và thuật toán xếp hạng đang quyết định rằng đó là một loại trang web có câu trả lời hay hơn.

Làm gì với các yếu tố xếp hạng?

Thuật toán xếp hạng không còn là người quyết định trang web nào sẽ xếp hạng trong top 10. Đây là lý do tại sao các nghiên cứu các yếu tố xếp hạng tổng hợp hàng triệu kết quả tìm kiếm có thể không chính xác. Nghiên cứu các yếu tố xếp hạng cho rằng các yếu tố xếp hạng chịu trách nhiệm cho 10 kết quả top đầu.

Nhưng các yếu tố xếp hạng không phải lúc nào cũng quyết định những gì xếp hạng trong top 10. Đó là lý do tại sao các nghiên cứu về yếu tố xếp hạng có thể không đáng tin cậy.

Mặc dù thuật toán cụ thể này hiện không được sử dụng nhưng vẫn có các thuật toán khác đã thực hiện chức năng tương tự bằng cách đặt kết quả thuật toán xếp hạng sang một bên và xếp hạng lại SERPs bằng cách sử dụng các yếu tố không phải là các yếu tố xếp hạng.

Ví dụ: Google có bằng sáng chế về cách xếp hạng lại kết quả tìm kiếm được gọi là Ranking Search Results để đề cập đến việc sử dụng một công cụ sửa đổi.

"Hệ thống tìm kiếm 114 cũng chứa hoặc có thể giao tiếp với một công cụ sửa đổi điểm số 140 để tạo ra các yếu tố sửa đổi được áp dụng bởi hệ thống tìm kiếm 114 để điểm số ban đầu được tạo bởi công cụ tìm kiếm 130 với các nguồn tài nguyên phù hợp với truy vấn 110. Công cụ sửa đổi điểm số 140 có thể tạo ra các yếu tố sửa đổi dựa trên ít nhất một phần của dữ liệu sửa đổi để liên kết với một yếu tố sửa đổi tương ứng với một nhóm tài nguyên. Dữ liệu sửa đổi được lưu trữ trong kho lưu trữ có thể được truy cập vào hệ thống, ví dụ như yếu tố cơ sở dữ liệu sửa đổi 150".

Xếp hạng lại kết quả tìm kiếm không phải là một ý tưởng mới. Microsoft.com đã xuất bản một tài liệu nghiên cứu về xếp hạng lại kết quả tìm kiếm từ năm 2005 trong một bài viết có tiêu đề Improving Web Search Results Using Affinity Graph. Mục đích của thuật toán là phân bổ chính xác hơn ý định người dùng cho các truy vấn tìm kiếm không rõ ràng.

Điều này ảnh hưởng đến SEO như thế nào?

Trong tương lai điều này có thể ảnh hưởng đến SEO và kết quả có thể nhấn mạnh hơn vào việc đáp ứng ý định của người dùng. Loại cải tiến này là cải thiện mức độ liên quan. Do vậy, khi Google xuất bản một bản cập nhật liên quan, các câu trả lời cho lý do tại sao một trang web bị mất thứ hạng được tìm thấy bằng cách nghiên cứu những người chiến thắng. Với các loại cập nhật này, có thể bạn sẽ không thấy lý do thứ hạng đã thay đổi bằng cách xem xét các trang web bị mất vị trí SERP.

Chú ý: Bài viết có một số thuật ngữ tiếng Anh khó hiểu nên cần bấm vào link chi tiết để tìm hiểu. Bài viết không dành cho newbie.

Ghi nguồn diễn đàn marketing khi sao chép lại nội dung này.
Bài viết có tham khảo và sử dụng nội dung từ SEL, SEJ...
Link:
Google phát hành nghiên cứu thuật toán mới.
 

Bạn có quan tâm?

Donate

Thành viên trực tuyến

Không có thành viên trực tuyến.