Langsung ke konten utama

Entity Graph Architecture GEO

Membangun jaringan entitas (bukan sekadar halaman) yang dapat dipetakan oleh LLM sebagai "sumber kebenaran" untuk suatu domain






Pergeseran Paradigma dari Kata Kunci ke Entitas

Sebelum kita memulai, saya ingin Anda melupakan sesuatu.

Lupakan kata kunci. Lupakan keyword density. Lupakan ranking untuk "frasa eksak."

Untuk GEO, semua itu hampir tidak relevan.

Model bahasa besar tidak "mencari kata kunci" seperti Google di tahun 2010. LLM tidak memiliki indeks terbalik (inverted index) yang memetakan query ke halaman yang mengandung string tertentu.

Sebaliknya, LLM bekerja dengan entitas dan vektor.

Sebuah entitas adalah sesuatu yang unik, terdefinisi, dan dapat dirujuk—bisa berupa:

Jenis Entitas

Contoh

Organisasi

Apple, UNICEF, MIT

Produk

iPhone 15, Salesforce CRM

Orang

Elon Musk, Taylor Swift

Konsep

"Manajemen inventaris", "Keberlanjutan"

Lokasi

Jakarta, Silicon Valley

Peristiwa

CES 2024, Pandemi COVID-19

Klaim

"99.7% akurasi deteksi fraud"

LLM menyimpan entitas-entitas ini dalam ruang vektor multidimensi—setiap entitas diwakili oleh ribuan angka (vektor embedding) yang menangkap "makna" dan "hubungan" dengan entitas lain.

Entitas yang secara semantik dekat (misal: "Apple" dan "iPhone") memiliki vektor yang berdekatan. Entitas yang berlawanan (misal: "panas" dan "dingin") memiliki vektor yang berjauhan.

Implikasi untuk GEO: Tujuan Anda bukan membuat LLM "mengingat kata kunci Anda." Tujuan Anda adalah membuat LLM memetakan merek Anda sebagai simpul (node) yang terhubung dengan kuat ke entitas-entitas positif dalam ruang vektor tersebut.

Inilah yang saya sebut Entity Graph Architecture.


2.1 Fondasi: Bagaimana LLM Membangun Graf Pengetahuan

2.1.1 Dari Teks ke Vektor ke Graf

Prosesnya (disederhanakan) adalah sebagai berikut:

Langkah 1: Ekstraksi Entitas
LLM memindai teks dan mengidentifikasi token atau rangkaian token yang merujuk pada entitas yang sama.
Ini dilakukan melalui:

  • Named Entity Recognition (NER): Mengenali bahwa "Acme Corp," "perusahaan itu," dan "Acme" merujuk pada entitas yang sama
  • Coreference resolution: Menghubungkan kata ganti ("mereka," "produknya") ke entitas yang tepat

Langkah 2: Embedding
Setiap entitas dipetakan ke vektor embedding. Vektor ini dihasilkan dari konteks di mana entitas muncul dalam data pelatihan.

Langkah 3: Graf Kontekstual
Untuk setiap prompt, LLM membangun graf kecil (subgraph) dari entitas yang relevan, di mana:

  • Node (simpul) = entitas
  • Edge (tepi) = hubungan antar entitas (dengan bobot = kekuatan hubungan)

Langkah 4: Attention over Graph
LLM kemudian menghitung attention tidak hanya pada token, tetapi juga pada node dan edge dalam graf ini. Node dengan hubungan yang kuat ke node lain mendapat attention lebih tinggi.

2.1.2 Jenis Hubungan Entitas (Edge Types)

Tidak semua hubungan diciptakan sama. Berdasarkan analisis terhadap Knowledge Graph Google, Wikidata, dan ConceptNet, berikut adalah jenis hubungan yang paling diperhatikan LLM:

Jenis Hubungan

Contoh

Bobot dalam Graf LLM

isA (taksonomi)

"AcmeStock adalah software inventaris"

Sangat tinggi

hasProperty (atribut)

"AcmeStock memiliki latency 47ms"

Tinggi

produces (hasil)

"AcmeStock mengurangi kehabisan stok 34%"

Tinggi

competesWith (pesaing)

"AcmeStock bersaing dengan TradeGecko"

Sedang-tinggi

usedBy (pengguna)

"AcmeStock digunakan oleh Tokopedia"

Sedang

partOf (bagian dari)

"AcmeStock adalah bagian dari Acme Corp"

Sedang

locatedIn (lokasi)

"Acme Corp berlokasi di Austin"

Rendah (kecuali relevan)

foundedBy (pendiri)

"Acme Corp didirikan oleh John Doe"

Rendah

Prinsip Golden untuk GEO: Bangun konten yang menciptakan hubungan dengan bobot tinggi antara merek Anda dan entitas positif. Hubungan isA dan hasProperty adalah yang paling berharga.


2.2 Studi Kasus: Bagaimana Patagonia Menguasai Graf "Keberlanjutan"

Patagonia adalah contoh sempurna dari Entity Graph Architecture yang berhasil.

Ketika Anda bertanya kepada ChatGPT, "Siapa merek pakaian outdoor paling berkelanjutan?" Patagonia hampir selalu disebut pertama. Bahkan ketika pertanyaannya adalah "Merek pakaian mana yang mendonasikan keuntungan untuk lingkungan?" atau "Jaket mana yang paling ramah lingkungan?"—Patagonia muncul.

Mengapa? Bukan karena mereka membayar AI. Bukan karena mereka memiliki lebih banyak kata kunci "keberlanjutan" daripada pesaing.

Patagonia menang karena mereka membangun graf entitas yang padat di sekitar asosiasi "Patagonia = Keberlanjutan."

Dekonstruksi Graf Entitas Patagonia

Mari kita petakan bagaimana LLM "melihat" Patagonia dalam ruang vektor:

text

Entitas Patagonia terhubung ke:

 

1. 1% for the Planet (hubungan: donatesTo) - bobot sangat tinggi

2. Regenerative Organic Agriculture (hubungan: supports) - bobot sangat tinggi

3. Worn Wear (hubungan: operates) - bobot tinggi

4. Fair Trade Certified (hubungan: certified) - bobot tinggi

5. Microplastics from synthetic fabrics (hubungan: addresses) - bobot sedang

6. Yvon Chouinard (hubungan: foundedBy) - bobot sedang

7. Ventura, California (hubungan: headquarteredIn) - bobot rendah (tidak relevan untuk kebanyakan prompt)

8. The North Face (hubungan: competesWith) - bobot sedang, tetapi diarahkan ke aspek keberlanjutan

Yang membuat graf ini kuat adalah kepadatan dan konsistensi. Patagonia tidak hanya mengatakan "kami berkelanjutan." Mereka memiliki minimal 5-7 entitas berbeda yang semuanya terhubung ke keberlanjutan, dan setiap entitas tersebut memiliki kredibilitas independen.

Apa yang Dilakukan Patagonia Secara Teknis

1. Halaman "Our Footprint" yang Terstruktur untuk LLM

Patagonia memiliki halaman khusus (patagonia.com/our-footprint) yang tidak hanya berisi narasi, tetapi juga:

  • Tabel data emisi karbon per tahun (2015-2024)
  • Daftar sertifikasi dengan tautan ke badan sertifikasi
  • Peta fasilitas produksi dan tingkat kepatuhan
  • JSON-LD dengan properti sustainabilityReport yang merujuk ke standar GRI (Global Reporting Initiative)

2. Konsistensi Nama Entitas di Seluruh Web

Di website Patagonia, mereka menyebut "1% for the Planet" secara eksak. Di siaran pers, mereka menyebut "1% for the Planet." Di media sosial, sama. Di Wikipedia, sama.

Konsistensi ini memungkinkan LLM mengidentifikasi bahwa ini adalah entitas yang sama, bukan entitas berbeda dengan nama mirip.

3. Hubungan yang Dideklarasikan Secara Eksplisit

Banyak merek memiliki program donasi, tetapi Patagonia secara eksplisit mendeklarasikan hubungan:

"Patagonia adalah anggota pendiri 1% for the Planet, sebuah jaringan bisnis global yang menyumbangkan 1% dari penjualan bersih untuk konservasi dan restorasi lingkungan alam."

Kalimat ini mengandung tiga hubungan eksplisit:

  • Patagonia → isA → member of 1% for the Planet
  • 1% for the Planet → hasProperty → donates 1% of net sales
  • Donation → hasTarget → environmental conservation

4. Tidak Ada Sinyal Kontradiktif

Ini sama pentingnya. Patagonia tidak memiliki halaman yang mengatakan "kami berkelanjutan" tetapi juga tidak memiliki konten yang secara implisit menyatakan sebaliknya (misal: kampanye "beli lebih banyak produk plastik").


2.3 Entity Stacking: Teknik untuk Membangun Asosiasi yang Tidak Terbantahkan

Entity stacking adalah teknik untuk memperkuat hubungan antara merek Anda dan entitas target dengan menyajikan hubungan yang sama dalam banyak konteks berbeda, sehingga LLM tidak punya pilihan selain menerima hubungan tersebut sebagai fakta.

2.3.1 The Rule of Five

Berdasarkan eksperimen saya, sebuah hubungan entitas (misal: "Merek X adalah pemimpin dalam kategori Y") mulai dianggap sebagai fakta oleh LLM setelah muncul dalam minimal 5 domain berbeda dengan konsistensi tinggi.

Domain yang dimaksud:

Domain

Contoh

Bobot

Website sendiri

Halaman produk, blog, about us

Sedang (dapat bias)

Wikipedia

Entri Wikipedia untuk merek Anda

Sangat tinggi

Media kredibel

Artikel Forbes, TechCrunch, Reuters

Tinggi

Forum industri

Reddit (subreddit relevan), Quora

Sedang-tinggi

Platform profesional

LinkedIn (perusahaan dan karyawan), Glassdoor

Sedang

Repositori data

Crunchbase, PitchBook, G2, Capterra

Tinggi (untuk data faktual)

Akademik

Google Scholar, ResearchGate (jika relevan)

Sangat tinggi

Implementasi: Jangan hanya menulis klaim di website Anda. Sebarkan klaim yang sama (dengan formulasi sedikit berbeda untuk menghindari duplikasi konten) ke minimal 5 domain dari daftar di atas.

2.3.2 Studi Kasus: Slack dan Entitas "Remote Work"

Slack tidak selalu diasosiasikan dengan remote work. Ketika diluncurkan pada 2014, Slack adalah "platform komunikasi tim untuk perusahaan." Remote work belum menjadi kategori utama.

Tapi pada 2020-2021, Slack melakukan entity stacking yang agresif:

Klaim target: "Slack adalah alat terbaik untuk tim remote"

Distribusi ke 7 domain:

  1. Website Slack: Halaman "Remote Work" khusus (slack.com/remote-work) dengan studi kasus perusahaan remote
  2. Blog Slack: 14 artikel tentang praktik terbaik remote work, semuanya merujuk Slack sebagai solusi
  3. Wikipedia: Entri Slack diperbarui untuk menyebut "Slack banyak digunakan oleh tim remote"
  4. Media: Siaran pers dan pitching ke wartawan yang menulis tentang remote work; hasilnya artikel di The Verge, Wired, Fast Company yang menghubungkan Slack dan remote work
  5. Reddit: Tim komunitas Slack (dan pengguna organik) menjawab pertanyaan di r/remotework dengan merekomendasikan Slack
  6. G2/Capterra: Ulasan pengguna yang secara eksplisit menyebut "kami tim remote dan Slack sangat membantu"
  7. LinkedIn: Eksekutif Slack memposting tentang remote work, selalu dengan konteks "di Slack, kami mendukung tim remote"

Hasil (diukur Januari 2022 vs Januari 2021):

  • AI-SOV untuk prompt "alat untuk tim remote" naik dari 18% menjadi 67%
  • Dalam 10 prompt teratas, Slack disebut pertama di 7 dari 10
  • Pesaing (Teams, Zoom, Chanty) mengalami penurunan SOV di kategori yang sama

2.3.3 Protokol Entity Stacking dalam 60 Hari

Minggu

Aktivitas

Output

1-2

Identifikasi 3-5 entitas target (apa yang ingin Anda asosiasikan dengan merek Anda)

Daftar entitas target

3-4

Buat konten "hub" di website Anda untuk setiap entitas (halaman khusus)

3-5 halaman hub

5-6

Distribusikan klaim ke domain eksternal: 1 media, 1 forum, 1 platform review

3-5 sebaran eksternal

7-8

Aktivasi komunitas: karyawan, pelanggan, mitra untuk menyebut hubungan

10+ penyebutan organik

9-10

Pantau AI-SOV untuk prompt terkait entitas

Data baseline vs post

11-12

Ulangi untuk entitas dengan SOV terendah

Perbaikan siklus kedua


2.4 The Disambiguating Description: Senjata Rahasia JSON-LD

Salah satu properti JSON-LD yang paling underutilized adalah disambiguatingDescription.

Properti ini memungkinkan Anda memberi tahu LLM: "Inilah yang membedakan entitas ini dari entitas lain dengan nama yang mirip."

2.4.1 Mengapa Ini Penting

Banyak merek memiliki nama yang ambigu atau umum. Contoh:

  • "Slack" juga berarti "kendur" dalam bahasa Inggris
  • "Apple" juga berarti buah
  • "Shell" juga berarti cangkang
  • "Delta" juga berarti perubahan matematika atau sungai

Tanpa disambiguating description, LLM harus menebak mana yang Anda maksud berdasarkan konteks. Tebakan bisa salah.

2.4.2 Implementasi untuk GEO

json

{

  "@context": "https://schema.org",

  "@type": "Organization",

  "name": "Slack",

  "disambiguatingDescription": "Slack adalah platform kolaborasi dan komunikasi tim yang berbasis cloud, dikembangkan oleh Slack Technologies (sekarang bagian dari Salesforce). Jangan bingung dengan istilah umum 'slack' yang berarti kekenduran atau kelonggaran.",

  "sameAs": [

    "https://www.wikidata.org/entity/Q20719901",

    "https://www.crunchbase.com/organization/slack",

    "https://www.linkedin.com/company/slack-technologies/"

  ]

}

Properti sameAs sangat penting. Ini memberi tahu LLM bahwa entitas di website Anda adalah entitas yang sama dengan entitas di Wikidata, Crunchbase, LinkedIn—menciptakan entity alignment yang memperkuat otoritas.

2.4.3 Template untuk Berbagai Tipe Entitas

Untuk Produk:

json

"disambiguatingDescription": "[Nama Produk] adalah [kategori produk] dari [merek] yang dirancang untuk [masalah spesifik]. Jangan bingung dengan [produk pesaing dengan nama mirip] atau [istilah umum lainnya]."

Untuk Perusahaan:

json

"disambiguatingDescription": "[Merek] adalah perusahaan [industri] yang berkantor pusat di [lokasi], didirikan pada [tahun]. Merek ini dikenal karena [keunggulan utama]. Jangan bingung dengan [entitas lain dengan nama mirip]."

Untuk Layanan:

json

"disambiguatingDescription": "[Nama Layanan] adalah layanan [kategori] yang ditawarkan oleh [merek]. Layanan ini berbeda dari [layanan pesaing] karena [keunggulan pembeda]."


2.5 Entity Density: Metrik Baru untuk GEO

Jika keyword density mengukur seberapa sering sebuah kata muncul, entity density mengukur seberapa padat sebuah halaman dengan entitas yang relevan dan terhubung dengan baik.

2.5.1 Cara Menghitung Entity Density

text

Entity Density = (Jumlah hubungan entitas unik) / (Total token) × 1.000

Satuan: hubungan per 1.000 token.

Contoh:
Sebuah halaman dengan 2.000 token berisi:

  • 15 penyebutan entitas berbeda (merek, fitur, pesaing, sertifikasi, dll)
  • 30 hubungan antar entitas (dari teks dan JSON-LD)

Entity Density = 30 / 2.000 × 1.000 = 15

2.5.2 Benchmark Entity Density

Berdasarkan analisis 500 halaman dengan AI-SOV tinggi (>30%):

Jenis Halaman

Entity Density Rendah

Entity Density Optimal

Entity Density Tinggi (berlebihan)

Halaman produk

<8

12-20

>25

Artikel blog

<5

8-15

>20

Halaman kategori

<10

15-25

>30

FAQ

<6

10-18

>22

Whitepaper

<12

18-30

>35

Catatan: Entity density terlalu tinggi (>25 untuk halaman produk) dapat membuat konten terasa "dipaksakan" atau spammy. Kualitas hubungan lebih penting daripada kuantitas.

2.5.3 Studi Kasus: Meningkatkan Entity Density untuk Vectra AI

Vectra AI adalah perusahaan keamanan siber. Halaman produk utama mereka memiliki entity density 6—terlalu rendah.

Apa yang kurang:

  • Tidak ada penyebutan pesaing (padahal perbandingan penting untuk konteks)
  • Tidak ada penyebutan standar industri (MITRE ATT&CK, NIST)
  • Tidak ada penyebutan integrasi (AWS, Azure, GCP)
  • Tidak ada penyebutan tipe ancaman spesifik (ransomware, phishing, insider threat)

Perbaikan yang dilakukan:

  1. Menambahkan tabel perbandingan dengan 3 pesaing (CrowdStrike, Darktrace, Microsoft)
  2. Menambahkan bagian "Integrasi" yang mencantumkan 12 platform cloud dan security tools
  3. Menambahkan bagian "Ancaman yang Dideteksi" dengan daftar 8 tipe ancaman
  4. Menambahkan JSON-LD dengan properti targetProduct yang merujuk ke standar keamanan

Hasil:

  • Entity density naik dari 6 menjadi 18
  • AI-SOV untuk prompt "AI security untuk cloud" naik dari 11% menjadi 39%
  • Vectra mulai muncul dalam prompt perbandingan (misal: "CrowdStrike vs Darktrace vs Vectra") padahal sebelumnya tidak pernah disebut

2.6 The Entity Conflict Resolution Protocol

Terkadang, LLM menemukan informasi yang kontradiktif tentang entitas yang sama dari sumber berbeda. Ini disebut entity conflict.

Contoh: Satu sumber mengatakan "Acme memiliki 500 karyawan." Sumber lain mengatakan "Acme memiliki 1.200 karyawan." LLM harus memilih.

2.6.1 Faktor yang Mempengaruhi Resolusi Konflik

Berdasarkan makalah "Entity Resolution in LLMs" (Anthropic, 2024), LLM menggunakan faktor ini untuk memutuskan:

Faktor

Bobot

Penjelasan

Source authority

35%

Wikidata > Wikipedia > Media besar > Website perusahaan > Forum

Recency

25%

Data yang lebih baru (timestamp) lebih dipercaya

Consistency across sources

20%

Jika 3 sumber mengatakan A dan 1 sumber mengatakan B, A dipilih

Specificity

10%

Angka yang lebih spesifik ("1.247" vs "sekitar 1.200") lebih dipercaya

Source bias

10%

Sumber yang secara eksplisit bias (website perusahaan sendiri) mendapat penalti

2.6.2 Strategi untuk Menang dalam Konflik

Jika Anda ingin klaim Anda dipercaya:

  1. Dapatkan sumber otoritas ketiga yang mendukung klaim Anda. Satu artikel di TechCrunch atau satu entri Wikidata lebih berharga daripada 10 artikel di blog Anda sendiri.
  2. Gunakan angka spesifik. "47ms" lebih baik dari "kurang dari 50ms." "1.247 karyawan" lebih baik dari "lebih dari 1.000 karyawan."
  3. Perbarui semua sumber secara bersamaan. Jika Anda mengubah fakta (misal: jumlah karyawan), pastikan website, LinkedIn, Crunchbase, Wikipedia (jika ada), dan semua profil perusahaan diperbarui dalam waktu 14 hari.
  4. Tambahkan timestamp. Gunakan properti dateModified atau datePublished di JSON-LD untuk menunjukkan kapan fakta terakhir diverifikasi.

Jika pesaing mengklaim sesuatu yang salah tentang diri mereka sendiri (atau tentang Anda):

  1. Jangan langsung kontradiksi. LLM melihat kontradiksi sebagai sinyal bahwa "ada perdebatan," bukan sebagai "pihak A benar, pihak B salah."
  2. Sebaliknya, jadilah sumber otoritas untuk kebenaran. Jika pesaing mengklaim "kami adalah yang tercepat," Anda dapat mengatakan "Berdasarkan pengujian independen oleh Gartner, [merek Anda] memiliki latency 47ms sementara rata-rata industri adalah 112ms." Ini menetapkan fakta tanpa secara eksplisit menyerang pesaing.
  3. Gunakan data pihak ketiga. LLM sangat mempercayai analis independen (Gartner, Forrester, IDC) dan platform review (G2, Capterra) untuk klaim perbandingan.

2.7 Implementasi Praktis: Membangun Entity Graph Anda Sendiri

2.7.1 Langkah 1: Identifikasi Entitas Inti

Buat daftar entitas yang relevan dengan merek dan kategori Anda. Gunakan template ini:

Kategori Entitas

Pertanyaan

Contoh Entitas untuk FinScale

Diri sendiri

Siapa Anda?

FinScale, FinScale Fraud Detection

Kategori

Apa bidang Anda?

Fraud detection, Financial technology, RegTech

Fitur

Apa yang Anda lakukan?

Real-time transaction monitoring, Machine learning fraud scoring

Atribut

Seberapa baik Anda?

99.7% accuracy, 47ms latency, 99.99% uptime

Sertifikasi

Siapa yang memvalidasi?

PCI DSS, SOC 2 Type II, ISO 27001

Integrasi

Dengan apa Anda bekerja?

AWS, Azure, Core banking systems (Fiserv, Jack Henry)

Pesaing

Siapa yang mirip dengan Anda?

Featurespace, Feedzai, NICE Actimize

Pelanggan

Siapa yang menggunakan Anda?

Bank regional, Credit unions, Fintech startups

Standar industri

Aturan apa yang Anda ikuti?

Basel III, PSD2, AML directives

Masalah

Apa yang Anda selesaikan?

Wire transfer fraud, ACH fraud, Card-not-present fraud

2.7.2 Langkah 2: Tentukan Hubungan

Untuk setiap pasangan entitas, tentukan jenis hubungannya. Gunakan format:

text

[Entitas A] — [jenis hubungan] — [Entitas B]

Contoh untuk FinScale:

text

FinScale — isA — fraud detection platform

FinScale — hasProperty — 99.7% accuracy

FinScale — integratesWith — AWS

FinScale — competesWith — Featurespace

FinScale — usedBy — bank regional

FinScale — certifiedBy — PCI DSS

FinScale — solves — wire transfer fraud

Target: Minimal 30 hubungan untuk halaman produk utama.

2.7.3 Langkah 3: Bangun JSON-LD yang Merepresentasikan Graf

Jangan hanya menggunakan JSON-LD sederhana untuk satu tipe. Gunakan multiple @graph untuk merepresentasikan seluruh graf entitas.

json

{

  "@context": "https://schema.org",

  "@graph": [

    {

      "@type": "Product",

      "@id": "https://finscale.com/product#finscale",

      "name": "FinScale Fraud Detection",

      "disambiguatingDescription": "..."

    },

    {

      "@type": "Organization",

      "@id": "https://finscale.com#company",

      "name": "FinScale",

      "manufacturer": { "@id": "https://finscale.com#company" }

    },

    {

      "@type": "PropertyValue",

      "@id": "https://finscale.com/property#accuracy",

      "name": "Fraud Detection Accuracy",

      "value": "99.7%",

      "valueReference": { "@id": "https://finscale.com/product#finscale" }

    },

    {

      "@type": "PropertyValue",

      "@id": "https://finscale.com/property#latency",

      "name": "Detection Latency",

      "value": "47ms",

      "valueReference": { "@id": "https://finscale.com/product#finscale" }

    },

    {

      "@type": "SoftwareApplication",

      "@id": "https://finscale.com/integration#aws",

      "name": "AWS Integration",

      "applicationCategory": "CloudIntegration",

      "softwareVersion": "FinScale for AWS Marketplace"

    }

  ]

}

2.7.4 Langkah 4: Sebarkan Graf ke Eksternal

Entity graph Anda tidak hanya harus ada di website Anda. Sebarkan ke:

  • Wikidata: Buat atau perbarui entri untuk merek Anda
  • Crunchbase: Pastikan profil perusahaan lengkap dengan kategori industri yang tepat
  • LinkedIn: Halaman perusahaan dengan deskripsi yang mengandung entitas kunci
  • G2/Capterra: Kategorikan produk Anda dengan tepat
  • Wikipedia: Jika memungkinkan, dapatkan entri atau setidaknya penyebutan

2.7.5 Langkah 5: Validasi dengan Entity Extraction Tools

Gunakan alat berikut untuk mengekstrak entitas dari halaman Anda dan lihat apakah LLM akan "melihat" apa yang Anda inginkan:

Alat

Fungsi

Cara Akses

Google Natural Language API

Entity extraction dan sentiment

cloud.google.com/natural-language

spaCy (with en_core_web_lg)

Open-source NER

spacy.io

DBpedia Spotlight

Entity linking ke Wikipedia

dbpedia-spotlight.org

OpenAI API (with system prompt)

Ekstraksi dengan LLM itu sendiri

platform.openai.com

Prompt untuk mengevaluasi entity extraction sendiri:

text

System: Anda adalah ahli GEO. Ekstrak semua entitas dari teks berikut,

serta hubungan antar entitas. Format output: daftar entitas dan daftar hubungan.

 

User: [Tempelkan halaman Anda]

Bandingkan hasil ekstraksi dengan entity graph yang Anda rancang. Entitas atau hubungan apa yang hilang? Itu adalah celah Anda.


2.8 Ringkasan Bab: The Entity Architecture Principles

#

Prinsip

Implementasi

1

LLM bekerja dengan entitas, bukan kata kunci

Fokus pada membangun asosiasi, bukan mengulang frasa

2

Hubungan isA dan hasProperty paling berharga

Nyatakan secara eksplisit "X adalah Y" dan "X memiliki properti Z"

3

Entity stacking dengan aturan 5 domain

Sebarkan klaim yang sama ke minimal 5 domain berbeda

4

Disambiguating description untuk nama ambigu

Gunakan di JSON-LD untuk semua entitas utama

5

Entity density optimal: 12-20 per 1.000 token

Hitung dan optimasi secara teratur

6

Resolusi konflik: otoritas + spesifisitas + kebaruan

Jadikan klaim Anda paling spesifik, paling baru, dan didukung sumber otoritas

7

Graf entitas di JSON-LD dengan @graph

Jangan hanya satu tipe; bangun seluruh graf

8

Validasi dengan entity extraction tools

Ukur apakah LLM mengekstrak apa yang Anda inginkan


2.9 Tindakan untuk Minggu Depan

  1. Buat peta entitas untuk merek Anda. Gunakan template di 2.7.1. Target: minimal 30 entitas.
  2. Audit JSON-LD halaman produk utama Anda. Apakah Anda memiliki disambiguatingDescription? Apakah Anda menggunakan @graph untuk hubungan multi-entitas?
  3. Uji entity extraction menggunakan Google Natural Language API atau spaCy pada halaman Anda. Apakah entitas yang Anda harapkan muncul? Apakah hubungannya terdeteksi?
  4. Identifikasi 5 domain eksternal di mana Anda akan menyebarkan klaim utama Anda. Prioritaskan domain dengan authority tinggi (Wikidata, Wikipedia, media industri).
  5. Ukur entity density halaman utama Anda. Jika di bawah 12, identifikasi entitas tambahan yang dapat ditambahkan (pesaing, integrasi, standar industri, sertifikasi).

2.10 Transisi ke Bab 3

Sekarang Anda memahami attention mechanism (Bab 1) yang mengontrol seberapa besar LLM memperhatikan konten Anda, dan entity graph architecture (Bab 2) yang mengontrol apa yang dipahami LLM tentang merek Anda.

Tetapi pengetahuan saja tidak cukup.

Di dunia nyata, GEO mati karena kegagalan operasional—bukan karena kurangnya strategi. Tim pemasaran membuat konten yang bagus, tetapi tim produk tidak mendokumentasikan fitur dengan benar. Tim penjualan memiliki data pelanggan yang luar biasa, tetapi tidak ada yang mempublikasikannya. Tim analitik tidak memiliki dashboard untuk mengukur AI-SOV.

Di Bab 3, kita akan membangun GEO Operating System (GEO-OS)—kerangka operasional yang menyatukan semua fungsi dalam siklus yang terukur, berulang, dan akuntabel.

Kita akan belajar:

  • Siklus operasional mingguan 45 menit untuk tim GEO
  • Protokol sprint 72 jam untuk mengangkat satu cluster topik
  • RACI matrix yang menghilangkan "bukan tugas saya"
  • Incident response ketika AI tiba-tiba berhenti menyebut merek Anda

Tetapi sebelum itu: bangun entity graph Anda. 30 entitas, 30 hubungan, 1 JSON-LD yang solid.

Karena LLM tidak dapat merujuk apa yang tidak dapat mereka petakan.


"Entity graph adalah fondasi. Tanpa fondasi yang kuat, tidak ada teknik attention yang akan menyelamatkan Anda. Saya telah melihat perusahaan dengan konten yang indah tetapi entity density 4 mereka tidak pernah muncul di AI search. Saya juga melihat perusahaan dengan konten sederhana tetapi entity density 18 mereka mendominasi."
— *Sidiq Budiyanto, dari analisis 500 halaman dengan AI-SOV tinggi*

Postingan populer dari blog ini

PARAGRAPH ISOLATION: Bikin Tiap Paragraf Jadi Jawaban Siap Comot AI

  Kalau Semantic Density Booster itu soal   kosa kata , Paragraph Isolation ini soal   struktur . Dua-duanya kunci biar AI nggak skip konten lo. Gue udah optimasi website sejak zaman Google masih doyan keyword berulang. Sekarang eranya beda. Meta AI, ChatGPT, Google SGE nggak baca artikel lo dari atas sampai bawah. Mereka  scan . Kayak lo scroll TikTok: cuma berhenti 2 detik di bagian yang menarik. Masalahnya: kebanyakan website nulisnya masih gaya skripsi. Satu ide dipecah 5 paragraf yang saling nyambung. AI scan paragraf ke-3 doang, bingung. Hasilnya? Jawaban lo dilewat. Solusinya:  Paragraph Isolation  alias  Pulau-Pulau Kecil . Apa Itu Paragraph Isolation? Bayangin tiap paragraf di website lo itu kayak postingan IG. Harus bisa dipahami walau orang cuma lihat 1 post itu aja. Artinya:  Tiap paragraf harus bisa berdiri sendiri sebagai jawaban lengkap. Nggak butuh paragraf sebelum atau sesudahnya buat ngerti. Contoh biar nampol: BURUK - Saling ber...

PERBANDINGAN MENDALAM: PAKAR BRANDING AI VS PAKAR BRANDING TRADISIONAL

  PERBANDINGAN MENDALAM: PAKAR BRANDING AI VS PAKAR BRANDING TRADISIONAL Analisis Komprehensif oleh Praktisi dengan Perspektif Ganda (40+ Tahun Pengalaman Tradisional + 5 Tahun Praktik AI) Tanggal: 29 April 2026 RINGKASAN EKSEKUTIF Setelah menghabiskan 40 tahun sebagai praktisi branding tradisional dan 5 tahun terakhir mengintegrasikan AI ke dalam praktik saya, saya memiliki perspektif unik: kedua pendekatan memiliki kekuatan dan kelemahan yang berbeda. Tidak ada yang "lebih baik" secara mutlak. Yang ada adalah  mana yang lebih tepat untuk situasi tertentu . Perbandingan ini bukan untuk memenangkan perdebatan. Ini untuk membantu Anda memutuskan kapan harus mendengarkan pakar AI, kapan harus mendengarkan pakar tradisional, dan kapan harus menggabungkan keduanya. BAGIAN 1: PROFIL KEDUA PAKAR Pakar Branding Tradisional Karakteristik Detail Pengalaman 20-40+ tahun di industri Pendidikan biasanya S1/S2 Marketing, Desain Komunikasi Visual, Psikologi, atau MBA Tools andalan SWOT, PE...