Entity thực sự bí ẩn, dù đã tồn tại trong nhiều năm và ảnh hưởng đến nhiều khía cạnh của quá trình tìm kiếm, nhưng chúng lại hiếm khi được nhắc đến. Có lẽ một phần nguyên nhân là do không có nhiều thông tin chắc chắn về các Entity này và Google patents cũng không giúp ích được gì nhiều. Thế nhưng, ngay cả khi bạn hiểu về Entity, bạn vẫn không rõ liệu chúng có thể được sử dụng cho SEO hay không.
Trong bài viết này, MMO Team đã thu thập các thông tin cần thiết nhất về Entity, đồng thời cố gắng hết sức để dịch chúng từ ngôn ngữ sáng chế sang ngôn ngữ của con người. Chúng tôi đã cũng đã khám phá ra một số chiến thuật SEO trong suốt quá trình thực hiện.
Mục lục
Entity là gì?
Hãy cùng tham khảo một trong số các bằng sáng chế của Google để biết định nghĩa chính thức về các Entity nhé:
Entity là một sự vật hoặc khái niệm số ít, duy nhất, được xác định rõ ràng và có thể phân biệt được. Ví dụ, một Entity có thể là người, địa điểm, vật phẩm, ý tưởng, khái niệm trừu tượng, yếu tố cụ thể, hoặc bất kỳ sự kết hợp nào của chúng. Nói chung, các Entity bao gồm các sự vật hoặc khái niệm được biểu thị bằng ngôn ngữ danh từ. Ví dụ: màu “Xanh lam”, thành phố “Hà Nội” hay con vật tưởng tượng “Kỳ lân” đều có thể là các Entity.
Nói một cách ngắn gọn hơn, một Entity là bất cứ thứ gì đủ nổi bật để người dùng tìm kiếm nó theo tên. Ví dụ: tôi chưa đủ nổi tiếng để trở thành một thực thể – tôi chỉ là một trong số rất nhiều người viết về chủ đề SEO và không ai tìm kiếm tôi bằng tên cả. Nhưng đối với Mỹ Tâm thì lại hoàn toàn khác – cô ấy đã giành được một vị trí nhất định trong trái tim của người hâm mộ và trở thành một ca sĩ được công nhận rộng rãi với mật độ xuất hiện rộng khắp trên các trang web. Mỹ Tâm chính là một Entity!
Làm cách nào để Google tìm thấy các Entity?
Google đang xây dựng cơ sở dữ liệu Entity của mình bằng hai quy trình riêng biệt: sao chép các Entity hiện có và khám phá các Entity mới.
Hiện tại, Google chủ yếu sao chép các Entity của mình từ các cơ sở tri thức hiện có, như Wikipedia và IMDb. Nó cho phép Google phát triển cơ sở dữ liệu của riêng họ khá nhanh, nhưng vẫn giữ ở một chừng mực cụ thể bởi vì họ chỉ lấy từ một số nguồn đáng tin cậy. Hạn chế lớn nhất ở đây là những cơ sở kiến thức này có thể sẽ khá chậm chạp trong việc thu thập các Entity mới và cập nhật các Entity cũ, vì vậy Google sẽ đứng trước nguy cơ không cung cấp nội dung phù hợp cho người dùng.
Để giải quyết vấn đề này, Google đã cấp bằng sáng chế cho một số phương pháp phát hiện các Entity mới từ dữ liệu phi cấu trúc có sẵn trên web. Trong đó có một phương pháp đề xuất sử dụng các Entity đã biết để xem liệu chúng có được kết nối với bất kỳ Entity chưa biết nào hay không, thông qua cú pháp hoặc bằng cách xác định mật độ thường xuyên xuất hiện cùng nhau trong cùng một tài liệu. Ví dụ: nếu nhiều tài liệu nói rằng “Trịnh Công Sơn là một nhạc sĩ nổi tiếng tại Việt Nam”, là một thực thể đã biết, thì Google có thể xác định liệu Trịnh Công Sơn có thể là một thực thể hay không.
Một phương pháp khác đề xuất đo lường giá các thực thể dựa trên quy mô của nó, tức là nó sẽ dễ dàng trở thành một Entity đáng chú ý trong một lĩnh vực hẹp hơn là trong một lĩnh vực rộng. Ví dụ, một writer sẽ khá khó khăn để trở thành một Entity trong toàn bộ lĩnh vực SEO, nhưng dễ dàng hơn nhiều để ghi danh trong một danh mục con của SEO.
Google lưu trữ các Entity như thế nào?
Google duy trì cơ sở dữ liệu ngày càng phát triển của khoảng 5 tỷ Entity và hơn 500 tỷ thuộc tính Entity. Bảng dưới đây tóm tắt các loại thông tin mà Google thu thập về mỗi Entity cụ thể:
Data type | Example | Comment |
Name | Californication | Sử dụng từ ngữ của chính Google, tên là biểu thị ngôn ngữ của Entity. Nhưng bản thân Entity thực sự được lưu trữ dưới dạng một ID duy nhất ↓ |
Entity ID | XXXXXX01 | ID duy nhất giúp phân biệt giữa các Entity có cùng tên. Ví dụ: chương trình truyền hình của Californication sẽ là IDXXXXXX01, trong khi ca khúc của California là IDXXXXXX02. |
Class | TV series | Một Entity có thể thuộc về bất kỳ số lượng lớp và phân lớp nào. Ví dụ, Californication là một bộ phim truyền hình, nhưng nó cũng là một bộ phim hài và chính kịch. Các lớp thường là các Entity theo đúng nghĩa của chúng. |
Attribute | August 13, 2007 | Một Entity có thể có bất kỳ số lượng thuộc tính nào. Ví dụ, Californication được phát hành vào ngày 13 tháng 8 năm 2007, chạy trong bảy mùa, David Duchovny đóng vai chính, được quay ở California và được đánh giá 57% trên Rotten Tomatoes. Các thuộc tính thường là các Entity theo đúng nghĩa của chúng. |
Relationship | Released on | Mối quan hệ là một cách mà một Entity được kết nối với các Entity khác. Ví dụ, Californication được phát hành vào ngày 13 tháng 8 năm 2007, chạy trong bảy mùa và có sự tham gia của David Duchovny. |
Relevance | 0.84 | Điểm liên quan đo lường sức mạnh và / hoặc tầm quan trọng của mối quan hệ giữa các Entity. Ví dụ: Google có thể tự tin 99% rằng Californication là một bộ phim truyền hình, 74% tự tin rằng nó là một bộ phim hài và 36% tự tin rằng nó là một bộ phim truyền hình. |
Cơ sở dữ liệu Entity có thể trông tương tự như sơ đồ bên dưới, nhưng thực tế phức tạp hơn nhiều. Trong lược đồ này, các hình bầu dục đại diện cho các thực thể, các hình chữ nhật là các mối quan hệ và các con số là điểm liên quan:
Cách để kiểm tra một thứ nào đó có phải là một Entity không?
Cách đơn giản và hiệu quả nhất là google đối tượng của bạn và xem đối tượng đó có bảng tri thức chuyên dụng (knowledge panel) hay không:
Một cách phức tạp hơn là sử dụng công cụ khai thác Entity để lấy danh sách tất cả các Entity mà google cho là phù hợp với truy vấn của bạn. Khi lấy Mick Jagger làm ví dụ, thì Google coi 40 thực thể có phần nào liên quan đến truy vấn, nhưng bản thân Mick Jagger giành chiến thắng với điểm phù hợp cao nhất là 9,747, trong khi đối thủ gần nhất là Bianca Jagger với điểm phù hợp là 3,055. Công cụ này cũng cho chúng ta biết loại Entity của chúng ta là gì, như vật, con người, tổ chức, v.v.
Và cách nâng cao nhất để kiểm tra xem một thứ có phải là Entity hay không là truy cập nguồn và sử dụng API Tìm kiếm Sơ đồ tri thức của Google (Google’s Knowledge Graph Search API) để xem mã đằng sau đối tượng của bạn. Phương pháp này không được chuộng lắm vì nó ít thân thiện với người dùng hơn và thông tin bổ sung duy nhất mà nó cung cấp là ID Entity. Tuy nhiên, nếu những phương pháp liệt kê bên trên không thực sự hiệu quả, bạn luôn có thể áp dụng phương pháp này:
{
"result": {
"description": "Singer",
"image": {
"url": "https://pt.m.wikipedia.org/wiki/Ficheiro:Mick_Jagger_Deauville_2014.jpg",
"contentUrl": "https://encrypted-tbn1.gstatic.com/images?q=tbn:ANd9GcQWKDS8YTwb0wu7sRIN4P_IblmoYNW1NVbnIxWgGQ-rhhlylU7H"
},
"@type": [
"Thing",
"Person",
"Organization"
],
"@id": "kg:/m/01kx_81",
"detailedDescription": {
"articleBody": "Sir Michael Philip Jagger is an English singer, songwriter, actor, and film producer who has gained worldwide fame as the lead singer and one of the founder members of the Rolling Stones. ",
"url": "https://en.wikipedia.org/wiki/Mick_Jagger",
"license": "https://en.wikipedia.org/wiki/Wikipedia:Text_of_Creative_Commons_Attribution-ShareAlike_3.0_Unported_License"
},
"name": "Mick Jagger",
"url": "http://www.mickjagger.com/"
},
"resultScore": 9747.802734375,
"@type": "EntitySearchResult"
},
Google sử dụng các Entity như thế nào?
Bất cứ khi nào có một truy vấn tìm kiếm bao gồm một Entity, Google sẽ sử dụng cơ sở dữ liệu thực thể của nó để nâng cao kết quả tìm kiếm. Đáng chú ý nhất, Google sử dụng các Entity để thêm vào Knowledge panels, đưa ra các đề xuất tìm kiếm và nâng cao mức độ liên quan của các trang được phục vụ (served pages).
Knowledge panels
Knowledge panel giống như một trích dẫn tối giản được đặt ngay trên trang kết quả tìm kiếm. Ngoài tên, hình ảnh và mô tả của đối tượng, panel thường bao gồm một số thuộc tính quan trọng nhất của đối tượng, các thuộc tính này khác nhau tùy thuộc vào loại đối tượng:
Đề xuất SERP
Vì Google biết các lớp của Entity nó có thể đưa ra đề xuất về các Entity khác từ cùng một lớp. Ví dụ: nếu tôi đang tìm kiếm Arc’teryx, Google sẽ xác định nó là thương hiệu áo khoác ngoài và hỏi tôi xem tôi có muốn xem các nhãn hiệu áo khoác ngoài khác, như Patagonia và The North Face không:
Sử dụng cùng một logic, giờ đây bạn có thể tìm kiếm toàn bộ các lớp Entity và xem một số đề xuất được cung cấp ngay trong tìm kiếm. Ví dụ: nếu bạn tìm kiếm những bộ phim hành động hay nhất, Google sẽ cung cấp một loạt các đối tượng được phân loại là phim hành động để bạn lựa chọn:
Thứ hạng trang
Có lẽ tính năng quan trọng nhất đó là các Entity cho phép Google giảm ảnh hưởng của các từ khóa và liên kết, vốn được xem là các tín hiệu xếp hạng, và thay vào đó tìm kiếm ý nghĩa của nội dung. Những gì nó có thể làm là lập bản đồ các thực thể trong một phần nội dung và xem liệu bản đồ có hợp lý hay không, liệu tất cả các thực thể mong đợi có hiện diện và kết nối với nhau hay không.
Ví dụ: nếu bạn đang viết một bài báo về các bằng sáng chế của Google, thì Google có thể mong đợi bạn đề cập đến Bill Slawski, một chuyên gia về bằng sáng chế, cũng như Văn phòng Bằng sáng chế và Nhãn hiệu Hoa Kỳ, nơi các bằng sáng chế được trình nộp. Về mặt lý thuyết, các trang sử dụng tất cả các thực thể phù hợp, trong ngữ cảnh phù hợp, sẽ xếp trên các trang không sử dụng.
Cách sử dụng các Entity cho SEO?
Các Entity được kỳ vọng sẽ sớm thực hiện công việc của các liên kết ngược và từ khóa. Có lẽ không phải là tất cả, nhưng có lẽ là hầu hết. Và hệ thống xếp hạng sẽ trở nên khó chơi hơn nhiều vì Google sẽ có thể phân tích nhiều ngữ cảnh hơn trước đây.
Để đạt được điều này, nếu bạn muốn chứng minh chiến lược SEO của mình trong tương lai, bạn phải bắt đầu xây dựng các Entity của riêng mình và tăng cường kết nối với các Entity khác trong lĩnh vực của bạn. Dưới đây là một số điều bạn có thể bắt đầu làm ngay hôm nay:
Xây dựng thực thể thương hiệu của bạn (brand entity)
Bổ sung Entity của riêng bạn vào Sơ đồ tri thức Google (Google Knowledge Graph) sẽ giúp ích rất nhiều cho chiến lược SEO. Và trong tất cả những tài sản trong doanh nghiệp, thương hiệu có lẽ là thứ dễ trở thành Entity nhất (trừ khi công ty bạn toàn người nổi tiếng!).
Hãy xây dựng brand entity bằng cách nâng cao nhận thức thương hiệu của bạn thông qua SEO và các kỹ thuật marketing. Trước tiên, hãy sáng tạo một tên thương hiệu thật độc đáo, có định vị rõ ràng (ví dụ: Arc’teryx là công ty may mặc chuyên về áo khoác ngoài), nhất quán với các thuộc tính thương hiệu (địa điểm, ngày thành lập, thành lập, v.v.), tạo lập và duy trì hồ sơ xã hội, đồng thời quảng bá thương hiệu, xây dựng tình yêu thương hiệu.
Sử dụng Schema markup
Nếu bạn không muốn lãng phí thời gian để chờ đợi Google tìm các Entity trên trang web của mình, bạn có thể tăng tốc bằng cách sử dụng dữ liệu có cấu trúc. Nó cung cấp một thư viện thẻ khổng lồ, có thể được sử dụng để cho Google biết phần nội dung nào của bạn là Entity và đâu là thuộc tính Entity.
Cụ thể, schema doanh nghiệp địa phương (local business schema) có thể được sử dụng để liên kết doanh nghiệp của bạn với các thực thể địa lý lân cận và tăng sự nổi bật của bạn trong local search. Đánh dấu tổ chức, cá nhân và tác giả có thể được sử dụng thêm để tạo kết nối giữa các thực thể trên trang web và hồ sơ của họ trên các trang web khác!
Xác nhận hồ sơ GMB
Xác nhận, tối ưu hóa và duy trì danh sách Google My Business (GMB) là phần quan trọng nhất của bất kỳ chiến lược local SEO nào. Tuy không nhất thiết sẽ biến doanh nghiệp của bạn thành Entity, nhưng nó sẽ giúp ích bạn khá nhiều trong xuyên suốt chặng đường.
Google sẽ sử dụng danh sách này để tìm hiểu thông tin cần thiết về doanh nghiệp của bạn và tạo cầu nối với các tổ chức địa phương khác, và từ đó góp phần nâng tầm thứ hạng của doanh nghiệp bạn tại khu vực. Có thể thấy rằng, hiệu ứng này rất giống với việc trở thành một Entity, chỉ khác là về mặt kỹ thuật, cơ sở dữ liệu doanh nghiệp cục bộ tách biệt với Knowledge Graph.
Tìm kiếm entity cho content của bạn
Bất cứ khi nào bạn chuẩn bị cho ra đời một content mới, hãy đảm bảo rằng content đó bao gồm các Entity khác nhau mà Google cho là có liên quan đến chủ đề của bạn. Đây là cách bạn có thể nghiên cứu các Entity này:
Google search
Trước hết, chúng ta đều biết rằng Google sử dụng các liên kết Entity để nâng cao kết quả tìm kiếm. Chính vì thế, một điều mà chúng ta có thể làm là google chủ đề chính của content và xem các loại đề xuất Entity nào xuất hiện trong mục tìm kiếm.
Ví dụ, nếu bạn đang lên kế hoạch cho một bài viết về áo khoác nam đẹp nhất, bạn có thể google chủ đề của mình và kiểm tra phần “Mọi người cũng hỏi” để biết các câu hỏi có liên quan:
Sau đó, lướt xuống cuối trang kết quả của công cụ tìm kiếm (SERP) và xem các tìm kiếm liên quan:
Sau đó, chuyển sang tìm kiếm hình ảnh và lướt qua các công cụ sửa hủyđổi tìm kiếm được đề xuất:
Wikipedia
Chúng ta đều biết rằng Google sử dụng Wikipedia làm một trong những nguồn cho cơ sở dữ liệu Entity của mình, vì vậy bạn hoàn toàn có thể sử dụng Wikipedia để tra cứu các thuộc tính Entity và tìm các Entity liên quan khác. Ví dụ khi bạn viết một bài báo về Mick Jagger, Wikipedia sẽ cho bạn biết rằng bạn nên nhắc đến Keith Richards:
Natural Language API
Và phương pháp cuối cùng đó là sử dụng bản demo API ngôn ngữ tự nhiên của Google (API NLP) – công nghệ xử lý văn bản và xác định Entity. Bản thân công nghệ này phải trả phí mới sử dụng được, nhưng bản demo lại hoàn toàn miễn phí.
Những gì bạn cần làm là sao chép những content xếp hạng top của đối thủ cạnh tranh, cho chúng chạy trong API NLP và khám phá các Entity nổi bật được đề cập trong content, cụ thể như sau:
Công cụ này có thể sẽ phát hiện ra hàng trăm Entity cho mỗi văn bản, nhưng chỉ một vài trong số chúng có điểm số Salience score ở mức cao. Lấy một vài Entity nổi bật nhất từ đối thủ cạnh tranh, cộng hưởng với danh sách Entity bạn có được từ tìm kiếm trên Wikipedia và Google, và bạn đã có cho mình một danh sách các Entity để đưa vào content của mình.
Tái Bút
Thử tưởng tượng các Entity như mô hình kỹ thuật số của thế giới thực và bạn hãy nghĩ xem SEO sẽ phát triển như thế nào? Có lẽ mô hình sẽ trở nên tuyệt vời đến mức chúng ta sẽ không cần SEO để giải thích content của mình cho các công cụ tìm kiếm. Hoặc có lẽ nó sẽ trở nên vô cùng phức tạp và chúng ta sẽ phải sử dụng hàng tấn dữ liệu có cấu trúc để giúp Google hiểu những gì đang diễn ra. Nhưng cho dù theo hướng nào đi chăng nữa thì chắc chắn rằng tầm quan trọng của các Entity sẽ ngày càng phát triển và những người bắt đầu sử dụng chúng ngay hôm nay sẽ là những chiến binh giành chiến thắng về lâu dài.
Đọc thêm: Nhồi nhét từ khóa và “án phạt” từ Google cho nội dung kém chất lượng