Những vấn đề cần biết từ thuật toán RankBrain của Google - Dịch vụ seo

Những vấn đề cần biết từ thuật toán RankBrain của Google

RankBrain là gì?

RankBrain là tên của Google cho một hệ thống trí tuệ nhân tạo có tên là Machine Learning (tạm hiểu là máy học), nó được sử dụng để giúp xử lý kết quả tìm kiếm của họ – thông tin từ Bloomberg và Google cũng khẳng định với chúng tôi điều đó.

Máy học là gì?

Máy học là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống “học” tự động từ dữ liệu để giải quyết những vấn đề cụ thể.

Trí tuệ nhân tạo là gì?

Trí tuệ nhân tạo hay còn gọi là AI là là một lĩnh vực của khoa học và công nghệ nhằm làm cho máy có những khả năng trí tuệ của con người như: biết suy nghĩ và lập luận để giải quyết vấn đề, biết giao tiếp do hiểu ngôn ngữ và tiếng nói, biết học và tự thích nghi…

Về cơ bản AI chỉ tồn tại trong tiểu thuyết khoa học viễn tưởng. Trong thực tế, AI được dùng để chỉ các hệ thống máy tính được thiết kế để tìm hiểu và thực hiện các kết nối.

AI khác với máy học như thế nào? Theo thuật ngữ RankBrain, nó có vẻ giống nhau. Nó có thể được sử dụng để thay thế cho nhau hoặc máy học được sử dụng để mô tả các dạng tiếp cận trí tuệ nhân tạo được sử dụng.

Vậy RankBrain có phải là cách hoàn toàn mới để Google xếp hạng kết quả tìm kiếm?

Không. RankBrain là một phần trong tổng thể thuật toán tìm kiếm của Google, một chương trình máy tính được sử dụng để lọc ra hàng tỷ trang web mà nó biết và tìm những trang web được coi là phù hợp nhất cho các truy vấn cụ thể.

Tên thuật toán tìm kiếm của Google là gì?

Nhung-dieu-can-biet-ve-thuat- toan- RankBrain- cua -Google

Nó được gọi là Hummingbird, như chúng tôi đã báo cáo trước đây. Qua nhiều năm, các thuật toán tổng thể đã không có một cái tên chính thức. Nhưng vào giữa năm 2013, Google cải tổ thuật toán đó và đặt cho nó một cái tên – Hummingbird.

Vậy RankBrain có phải là một phần của thuật toán tìm kiếm Google Hummingbird?

Theo sự hiểu biết của chúng tôi, Hummingbird là thuật toán tìm kiếm tổng thể, giống như một chiếc xe có động cơ tổng thể trong đó. Nó có thể được tạo thành từ các bộ phận khác nhau, chẳng hạn như bộ lọc dầu, bơm nhiên liệu, bộ tản nhiệt…Theo cách hiểu đó, Hummingbird bao gồm các bộ phận khác nhau, và RankBrain là một trong những cái mới nhất.

Đặc biệt, chúng ta biết RankBrain là một phần của thuật toán Hummingbird tổng thể bởi vì các bài báo của Bloomberg cho thấy rõ rằng RankBrain không xử lý tất cả các tìm kiếm.

Hummingbird cũng chứa các bộ phận khác nhau với những cái tên quen thuộc với người làm SEO như Panda, Penguin và Payday được thiết kế để chống spam, Pigeon được thiết kế để cải thiện kết quả địa phương, Top Heavy được thiết kế để hạ cấp các trang quảng cáo quá nhiều, Mobile Friendly được thiết kế để thưởng cho những trang mobile-friendly và Pirate được thiết kế để chống vi phạm bản quyền.

Tôi nghĩ thuật toán Google được gọi là “PageRank”

PageRank là một phần của thuật toán Hummingbird tổng thể. PageRank là đặc biệt vì nó là tên đầu tiên mà Google từng đưa vào và được coi là một phần của thuật toán xếp hạng của nó.

Vậy Google sử dụng “tín hiệu” để xếp hạng?

Tín hiệu là thứ Google sử dụng để giúp xếp hạng một trang web. Ví dụ, nó sẽ đọc các từ trên một webpage, vì thế những từ đó được coi là một tín hiệu. Nếu một số từ được in đậm, đó có thể là một tín hiệu cần được lưu ý. Việc tính toán được sử dụng như là một phần của PageRank và nó được sử dụng như là một tín hiệu: nếu một trang được ghi nhận là mobile-friendly thì đó là một tin hiệu đã được đăng ký.

Tất cả các tín hiệu được xử lý bởi các bộ phận khác nhau trong thuật toán Hummingbird để cuối cùng Google tìm ra được những trang mà Google thấy rằng nó là phù hợp.

Cần phải có bao nhiêu tín hiệu?

Nhung-dieu-can-biet-ve-thuat- toan- RankBrain- cua -Google1

Google khá nhất quán khi nói đến 200 tín hiệu xếp hạng quan trọng. Nếu bạn muốn biết thêm điều này, hãy xem bảng tuần hoàn các yếu tố SEO thành công

Đó là một hướng dẫn khá tốt, chúng tôi nghĩ rằng, đó là những yếu tố Google sử dụng để xếp hạng trang web.

RankBrain có phải là tín hiệu quan trọng thứ 3?

Đúng thế. Hệ thống này đã trở thành quan trọng trong mắt Google và nó được vươn lên đứng ở vị trí thứ 3. Từ bài viết Bloomberg:

RankBrain là một trong hàng trăm tín hiệu của một thuật toán để xác định những gì xuất hiện trên trang tìm kiếm của Google và nơi chúng được xếp hạng. Trong vài tháng nó đã được triển khai, RankBrain đã trở thành tín hiệu quan trọng thứ 3 góp phần vào kết quả của một truy vấn tìm kiếm.​

Tín hiệu quan trọng nhất đầu tiên và thứ 2 là gì?

Google sẽ không cho chúng ta biết tín hiệu nào là quan trọng đầu tiên và thứ 2 bởi chúng tôi đã hỏi 2 lần và không nhận đượcc câu trả lời.

Nhưng nếu biết được tín hiệu nào là quan trọng nhất mà Google đang sử dụng hiện nay là rất cần thiết. Và tôi nghĩ rằng Google cần phải giải thích điều đó.

Theo cá nhân tôi, các liên kết vẫn là tín hiệu quan trọng nhất. Và tín hiệu quan trọng thứ hai sẽ là “các từ”, bởi đó là nơi mà sẽ bao gồm tất cả mọi thứ.

 RankBrain làm gì?

Từ email của Google, RankBrain được sử dụng chủ yếu như là một cách để giải thích sự tìm kiếm mà mọi người gửi để tìm các trang có thể không có những từ được nhập.

Vậy Google đã làm như thế nào với những truy vấn đó?

Có, Google đã tìm thấy các trang bên ngoài các thuật ngữ mà ai đó nhập vào. Ví dụ, các năm trước, nếu bạn đã bước vào một trang web “shoe”, Google có thể không tìm các trang mà nói về “shoes” bởi vì về mặt kỹ thuật 2 từ đó là khác nhau. Nhưng giờ đây Google đã thông minh hơn để hiểu rằng shoes là một biến thể của shoe, giống như “running” là một biến thể của “run”.

Google cũng đã khéo léo sử dụng các từ đồng nghĩa, do đó nếu bạn tìm kiếm “sneakers”, nó sẽ hiểu rằng bạn cũng đang tìm kiếm “running shoes”. Thậm chí nó cũng còn hiểu có những trang về “Apple” chứ không phải là trái “apple”.

 Knowledge Graph 

Knowledge Graph được tung ra vào năm 2012, đây là một cách chứng minh sự đột phá của Google về sự kết nối giữa các từ. Quan trọng hơn, nó đã học được cách để tìm kiếm mọi thứ liên quan.

Strings có nghĩa là tìm kiếm các chuỗi chữ cái, chẳng hạn như trang phù hợp với cách đánh vần “Obama”. Thay vào đó khi người dùng nhập vào khung tìm kiếm “Obama” thì Google hiểu rằng mọi người đang tìm kiếm Tổng thống Mỹ Barack Obama.

Knowledge Graph là một cơ sở dữ liệu của các dữ kiện về những thứ trên thế giới và quan hệ giữa chúng. Đó là lý do tại sao bạn có thể tiến hành tìm kiếm như “when was the wife of obama born” và nhận được một câu trả lời về Michele Obama như dưới đây, mà không bao giờ sử dụng tên của bà:

RankBrain giúp hoàn thiện các truy vấn như thế nào?

Vấn đề là Google xử lý 3 tỷ lượt tìm kiếm mỗi ngày. Trong năm 2007, Google cho biết rằng 20-25% của các truy vấn đã không bao giờ được thấy trước đây. Trong năm 2013, nó giảm xuống còn 15%, trong đó đã được sử dụng một lần nữa trong bài viết Bloomberg của ngày hôm qua và được Google xác nhận lại với chúng tôi. Nhưng 15% của 3 tỷ USD vẫn là một số lượng lớn các truy vấn không bao giờ được nhập bởi bất kỳ người tìm kiếm – 450 triệu mỗi ngày.

Trong số các truy vấn phức tạp, cũng có các truy vấn được gọi là “long-tail”. RankBrain được thiết kế để giúp giải thích tốt hơn những thắc mắc và có hiệu quả đằng sau để tìm ra những trang tốt nhất cho người tìm kiếm.

Khi Google nói với chúng tôi, nó có thể nhìn thấy các mẫu tìm kiếm phức tạp dường như không có liên quan với nhau. Máy học sẽ làm việc tốt hơn với những truy vấn phức tạp trong tương lai. Quan trọng nhất, Google nói với chúng tôi rằng, nó có thể liên kết với các nhóm tìm kiếm với kết quả mà nó nghĩ rằng người tìm kiếm sẽ thích nhất.

Google không cung cấp các ví dụ về các nhóm tìm kiếm và cũng không cho biết chi tiết về cách RankBrain dự đoán các trang tốt nhất như thế nào. Nhưng sau này, nó có thể chuyển một tìm kiếm mơ hồ thành một cái gì đó cụ thể hơn, khi đó nó sẽ mang lại câu trả lời tốt hơn.

Ví dụ:

Trong khi Google không cấp thông tin thì bài viết của Bloomberg đã có một ví dụ về một tìm kiếm nơi mà RankBrain được cho là đang giúp đỡ. Dưới đây là ví dụ:

What’s the title of the consumer at the highest level of a food chain

“consumer” nghe có vẻ như một tài liệu tham khảo nào đó cho những người mua một cái gì đó. Tuy nhiên, nó cũng là một thuật ngữ khoa học về vấn đề tiêu thụ thực phẩm.

Khi bạn nhập truy vấn vào Google, nó sẽ cung cấp câu trả lời tốt ngay cả khi truy vấn của nó nghe có vẻ khá kỳ lạ:

Bây giờ, bạn hãy xem một tìm kiếm “top level of the food chain”, như hình dưới đây:

Hãy tưởng tượng rằng RankBrain đang kết nối đến các truy vấn dài và phức tạp để ra được một truy vấn ngắn hơn nhiều. Nó hiểu rằng tất cả chúng là giống nhau. Kết quả là, Google có thể tận dụng tất cả những gì nó biết về việc nhận câu trả lời cho các truy vấn phổ biến hơn để giúp cải thiện những gì nó cung cấp.

Tôi xin nhấn mạnh rằng tôi không biết RankBrain là sự kết nối của 2 cuộc tìm kiếm đó. Tôi chỉ biết ví dụ đầu tiên mà Google đưa ra. Điều này chỉ đơn giản như một minh họa cách RankBrain được sử dụng để kết nối với một tìm kiếm phổ biến như một cách để cải thiện mọi thứ.

Liệu Bing cũng có thể làm điều này với RankNet?

 

Trở lại năm 2005, Microsoft bắt đầu sử dụng hệ thống máy học của mình với tên gọi là RankNet. Trên thực tế, trưởng nhóm nghiên cứu và sáng tạo của RankNet gần đây đã được vinh danh. Nhưng trong những năm qua, Microsoft hầu như không đả động gì về RankNet.

Bạn có thể nghĩ rằng nó sẽ thay đổi. Cũng khá thú vị khi tôi cũng nhập vào khung tìm kiếm của Bing và nó đã trả về kết quả như hình ảnh sau:
Nhung cau hoi thuong gap ve thuat toan moi RankBrain cua Google 7 ​
Với một truy vấn này không thể khẳng định rằng RankNet cũng tốt như RankBrain của Google. Thật đáng tiếc là rất khó để so sánh được việc này.

Một vài ví dụ khác?

Google đã cung cấp cho chúng ta một ví dụ mới: “How many tablespoons in a cup?” Google cho biết rằng RankBrain cung cấp các kết quả khác nhau ở Úc và ở Hoa Kỳ với các truy vấn đó vì các phép các phép đo tại mỗi quốc gia là khác nhau, mặc dù có những cái tên tương tự.

Tôi đã cố gắng để kiểm tra điều này bằng cách tìm kiếm tại Google.com so với Google Australia. Tôi không thấy có sự khác biệt nhiều.

Liệu RankBrain có thực sự giúp đỡ bạn?

Với 2 ví dụ trên đã chứng minh cho sự vĩ đại của RankBrain, tôi thực sự tin rằng nó có thể thực hiện một tác động lớn như tuyên bố của Google. Việc tích hợp RankBrain, đến mức độ mà nó được cho là tín hiệu quan trọng thứ ba, là một sự thay đổi rất lớn. Tôi nghĩ rằng Google làm điều này khi họ thực sự tin rằng nó đã giúp đỡ họ.

Khi nào bắt đầu RankBrain?

Google nói với chúng tôi rằng họ sẽ có một buổi giới thiệu về RankBrain vào đầu năm 2015 và nó đã tồn tại một vài tháng nay.

Có nhiều truy vấn bị tác động hay không?

Google nói với Bloomberg rằng “phần lớn” các truy vấn đang được xử lý bởi RankBrain. Chúng tôi yêu cầu một con số cụ thể hơn nhưng không được đáp ứng.

RankBrain không ngừng học tập?

Google nói với chúng tôi rằng tất cả nghiên cứu về của RankBrain đều là offline. Nó là sự kết hợp của dữ liệu tìm kiếm trong quá khứ và việc nghiên cứu để từ đó đưa ra những dự đoán.

Những dự đoán đã được thử nghiệm và nếu được chứng minh là tốt thì sẽ có một phiên bản mới của RankBrain sẽ được go live. Sau đó, chu kỳ này sẽ được lặp đi lặp lại.

RankBrain có sàng lọc nhiều truy vấn?

Tín hiệu là một yếu tố thường được gắn với nội dung, chẳng hạn như các từ trên một trang, các liên kết trỏ vào một trang, cho dù trang đó có ở trên một máy chủ an toàn hay không. Chúng cũng có thể được gắn với người dùng, chẳng hạn như khi một người tìm kiếm được đặt ở vị trí đó hoặc lịch sử tìm kiếm và duyệt web của họ.

Vì vậy, khi Google nói về RankBrain là một tín hiệu thứ 3 quan trọng nhất, nó có phải là một tín hiệu xếp hạng? Vâng, Google khẳng định với chúng tôi rằng nó là một thành phần góp phần để xếp hạng một trang.

Tôi tìm hiểu về RankBrain như thế nào?

Google nói với chúng tôi rằng nếu bạn muốn tìm hiểu về từ “vectors” – các từ và cụm từ có thể được kết nối với toán học – bạn hãy kiểm tra bài viết trên blog này, nó sẽ nói về khái niệm học một cách có hệ thống.

Ngoài ra, còn có một bài nghiên cứu tại đây. Thậm chí bạn có thể thử nghiệm dự án máy học của riêng bạn bằng cách sử dụng công cụ word2vec của Google. Ngoài ra, Google và Microsoft cũng có riêng một khu vực về AI và máy học.

Nguồn tổng hợp