Chúng tôi giới thiệu bài viết Chân dung “thằng” Ây Ai của anh Lâm Nguyễn về Bản chất của AI là gì, được viết theo phong cách bình dân rất dễ hiểu.

Bản chất của AI là gì?
Họ hàng nhà AI rất đông, nhưng khấm khá nhất giờ là các mô hình ngôn ngữ lớn (LLM), tức AI thuộc nhánh NLP chuyên môn chính là văn vở.
Tuy là “nhà văn chính hiệu” nhưng các LLM lại là sản phẩm từ cuộc tình tay 3 của bọn toán, cụ thể là đại số tuyến tính, giải tích tối ưu và xác suất thống kê. Khác với người anh em từng rất nổi tiếng giờ hơi kém tí là AI trong các xe tự hành thiên về lý thuyết đồ thị, lý thuyết điều khiển và toán rời rạc. Cuộc tình tay 3 này đã “ấy” thế nào để ra sản phẩm là chatGPT, Grok, Gemini hay Claude?
Bước chuẩn bị tức huấn luyện, văn vở trên coi đời này được đem ra để cỗ máy toán học đầu tiên là giải tích vận hành. Mục đích là tìm ra các quy luật trong đám chữ ngồn ngộn đủ thể loại ký tự, kí hiệu, ngôn ngữ. Tìm quy luật là kiểu phức tạp hoá của trò 2 4 6 8 thì số tiếp theo là số mấy vậy đó. Các hàm giải tích gọi là hàm mất mát, giải chúng sẽ ra nghiệm, nghiệm được tổng hợp vào các bảng kích thước tiêu chuẩn thường là 512×512 hoặc 4096×4096 giống kích thước của container 20 hay 40 feet. Bảng này có tên là ma trận, không phải ma trận của anh Neo và Trinity đâu. Những “container” nghiệm gọi nôm na là công thức để nấu món ăn văn vở sau này. Các LLM thường có nhiều lớp lọc ý nghĩa hệt như máy lọc nước vậy đó, gọi là Transformer (chữ T trong GPT), có từ 60 đến 120 lớp transformer tùy mô hình. Để các công thức này chuẩn vị thì cần nấu thử nhiều lần, mỗi lần thử trên dữ liệu huấn luyện sẽ gọi hai bạn toán còn lại là đại số tuyến tính và xác suất thống kê tham gia. Việc nấu là nhiệm vụ của đầu bếp đại số tuyến tính với các phép nhân ma trận chiếm cỡ 90% khối lượng tính toán, chọn món trình bày lên mâm là việc của xác suất thống kê. Mỗi bước lọc nghĩa cần 7 lần nhân ma trận, 120 bước vị chi là 840 lần, đại khái là vậy nhưng thực tế sẽ chia nhánh nên nhiều hơn. Kết quả là có được bảng công thức chuẩn sau này cứ thế nêm nếm. Bên cạnh đó, ngôn ngữ tự nhiên được “xơ chế, rửa sạch và cắt khúc” thành các đơn vị nhét vào ma trận nhúng (container nguyên liệu). Rồi, khâu chuẩn bị đã xong chỉ chờ bắc lên bếp.
Bước nấu nướng, tức dọn món theo order của khách. Người dùng hỏi AI “người yêu của Chí Phèo là ai?” Lập tức phục vụ bàn sẽ mang đơn order này đưa vào bếp. Tại đây quá trình xử lý bắt đầu, dữ liệu đầu vào được chia nhỏ thành các đơn vị (token hoá) sau đó biến thành các vectơ (vectơ hoá) để chuẩn với quy trình. Đầu tiên, công thức được mang ra đối chiếu để tìm kiếm nguyên liệu chuẩn. Có nguyên liệu chuẩn phù hợp với món order thì quá trình nấu nướng của đầu bếp đại số tuyến tính bắt đầu. Chàng đầu bếp này thì hục xào xào nấu nấu với hàng trăm lần nhân ma trận, tốn điện dữ dằn từ các “bếp” GPU giá thành lên đến cả tỷ đồng sau đó tạo ra kết quả. Sắp món ăn lên khay bằng cách nhân ma trận output rồi gửi ra bàn (màn hình) cho khách là xong việc. Khách phản hồi ý kiến sẽ được tiếp thu để cải thiện quy trình.
Có bao nhiêu tham số trong một mô hình ngôn ngữ lớn. Dao động từ 20 tỷ (mô hình cho tải về của OpenAI là gpt-oss-20b) đến hàng nghìn tỷ như Qwen 3 Max của Alibaba có 1.500 tỷ hay của chatGPT 5 khoảng 1.800 tỷ tham số. Việc này được tính toán ra sao, thì cơ bản đó là số tham số trong các phép nhân ma trận. Cụ thể nếu dùng kích thước 512 thì mỗi ma trận sẽ là 512×512 tham số, mỗi tầng có 7 ma trận được sinh ra, lại nhiều nhánh chẳng hạn 8 nhánh, rồi tới 120 tầng. Đấy là tham số của phần attention thêm tham số của quá trình chuẩn bị, quá trình lên món, cộng lại thì đâu đó ra số lượng tham số của mô hình. Từ số tham số tính được khả năng lưu trữ xử lý, ví dụ mỗi tham số chiếm 2 bytes ghi chưa nén, thì các GPU phải là loại gì mới chạy được, chạy được mô hình nào.
Tóm lại, cũng tương tự cỗ máy đầu vào đút con bò đầu kia tòi ra cục xúc xích. LLM là cỗ máy toán học gồm 3 phần chính kể trên, vì thế các LLM giữ trọn vẹn những giới hạn toán học từ ADN tựa như di truyền vậy. Giới hạn này đảm bảo rằng không bao giờ có thứ gọi là linh hồn, trí tuệ, cảm xúc hay đơn giản là khả năng sáng tạo. Mặc dù các ông lớn và người hâm mộ rất thích một kịch bản ở đó AI thông minh như con người, song tin buồn là viễn cảnh lãng mạn ấy không bao giờ xảy ra trừ khi phải “nhân giống” với các công cụ khác ngoài toán, vật lý lượng tử chẳng hạn. Linh hồn, trí tuệ và cảm xúc chắc chắn cần phẩm chất phi định xứ của lượng tử.