Category Tin Tức

LLMLingua là gì?

LLMLingua là gì

Microsoft vừa ra mắt LLMLingua giúp tăng tốc độ suy luận của các mô hình ngôn ngữ lớn (LLM), đồng thời nâng cao hiệu suất và giảm kích thước mô hình xuống 20 lần. LLMLingua là gì? Giảm chi phí…

Retrieval Augmented Generation RAG là gì?

RAG là gì

RAG (Retrieval Augmented Generation) là một kỹ thuật nhằm nâng cao độ chính xác và độ tin cậy của các mô hình GenAI với các dữ kiện được lấy từ các nguồn bên ngoài. RAG là gì? Retrieval Augmented Generation…