RAG dan Data Kustom: Cara Melatih AI Chatbot !

What’s That RAG ?

idfuturetechin.com – RAG (Retrieval-Augmented Generation) itu teknik yang menggabungkan retrieval atau nyari info dari dokumen sama generation jawaban generatif ala LLM.

Bayangin chatbot kalian bukan cuma ngarang jawaban dari model, tapi juga mengambil fakta dari basis data kalian sendiri. Hasilnya? Jawabannya lebih akurat, up-to-date, dan sesuai konteks!

Singkatnya Retrieval mencari dokumen/knowledge base relevan, Generation membuat jawaban natural dari hasil pencarian.

Bagaimana Membuat RAG LLM Sendiri ?

Ada banyak framework retrieval (LangChain, Haystack), tapi LlamaIndex ini salah satu yang paling populer dan gampang dipakainya, kenapa karena Mudah diintegrasi ke LLaMA, GPT, Claude, Mendukung ragam storage (faiss, qdrant, milvus, dll.) dan Dukungan dokumentasi aktif

Sebelum kita nyemplung ke RAG pipeline, siapin dulu:

Python (≥ 3.8)
Pip atau Conda
VS Code / Jupyter Notebook
Model LLM (OpenAI, LLaMA, local model via ollama, dll.)
Dokumen pengetahuan (txt, pdf, csv)

Kalian bisa pakai dataset apapun: FAQ perusahaan, artikel pribadi, bahkan chat lama pacar yang mau dijadikan basis pengetahuan.

Install LlamaIndex

Buka terminal dan ketik:

pip install llama-index llama-index-core

Untitled RAG dan Data Kustom: Cara Melatih AI Chatbot !

Lihat dokumentasi resminya di LlamaIndex Docs

Kalau mau dukungan PDF, bisa install tambahan:

pip install llama-index-pdf

Load Model LLM

Pakai contoh OpenAI:

from llama_index.llms import OpenAI
llm = OpenAI(model="gpt-3.5-turbo")

Pakai local model via Ollama:

from llama_index.llms import Ollama
llm = Ollama(model="llama2")

Intinya, LlamaIndex fleksibel banget!

Siapkan Data / Dokumen

Kalian bisa load dokumen dari TXT, PDF, web page, atau CSV.

Contoh load dari teks:

from llama_index.core import SimpleDirectoryReader

documents = SimpleDirectoryReader("./data").load_data()

Kalau PDF:

from llama_index.readers.file import PDFReader

reader = PDFReader()
documents = reader.load_data(file_path="./data/ebook.pdf")

Buat Index

Index = struktur untuk retrieval. LlamaIndex punya banyak jenis (VectorStoreIndex, KeywordTableIndex, dll.).

Contoh pakai VectorStoreIndex:

from llama_index.core import VectorStoreIndex

index = VectorStoreIndex.from_documents(documents)

Defaultnya pakai embedding OpenAI. Bisa custom (Cohere, HuggingFace).

Buat Query Engine

Setelah index terbentuk, kita bikin query engine.

query_engine = index.as_query_engine()

Cara pakai:

response = query_engine.query("Apa itu RAG?")
print(response)

Gampang banget kan? Persis kayak ngobrol sama ChatGPT, tapi dengan pengetahuan tambahan dari dokumenmu sendiri.

Advanced – Simpan dan Muat Index

Biar hemat biaya embedding:

index.storage_context.persist(persist_dir="./index")

Load lagi:

from llama_index.core import StorageContext, load_index_from_storage

storage_context = StorageContext.from_defaults(persist_dir="./index")
index = load_index_from_storage(storage_context)

Integrasi Retrieval-Augmented Generation

LlamaIndex memisahkan retrieval dan generation. Kalau mau lebih “RAG-style”:

retriever = index.as_retriever()
retrieved_nodes = retriever.retrieve("Jelaskan RAG LLM")
for node in retrieved_nodes:
    print(node.text)

Gabungkan dengan LLM untuk hasil akhir:

from llama_index.core import RetrievalAugmentedGeneration

rag_engine = RetrievalAugmentedGeneration(retriever=retriever, llm=llm)
response = rag_engine.generate("Apa itu RAG?")
print(response)

Voila! Retrieval + Generation = jawaban berbasis sumbermu sendiri.

Retrieval Augmented Generation merupakan cara yang efisien untuk melatih LLM pada data tertentu. LlamaCloud menawarkan cara yang sederhana dan mudah untuk membangun kerangka kerja RAG kalian sendiri dan meminta model yang ada di bawahnya.

Dari installasi sampai integrasi retrieval + generation. Intinya RAG itu bikin LLM lebih cerdas karena bisa nyari sumber sendiri. Dan LlamaIndex bikin semua itu gampang banget.

Jadi, nggak ada alasan lagi bilang “Aku bingung bikin chatbot yang bisa jawab berdasarkan dokumen sendiri!” – sekarang kalian udah tahu caranya.

jika ada salah kata dan salah penulisan atau bahkan salah menaruh rasa kami mohon maaf.

Sekian dan terima kasih !

Jangan lupa follow akun Instagram, TikTok, Youtube Digivestasi agar Anda tetap update