AlphaGeometry của Google vượt qua phương pháp tiếp cận tiên tiến nhất cho các bài toán hình học, thúc đẩy khả năng suy luận AI trong toán học.
Xem thêm Phải học gì để không bị AI thay thế?
AlphaGeometry là gì?
Google DeepMind với 3 thành viên quan trọng người Việt là Trieu H. Trinh, Quoc V. Le và Thang Luong vừa xuất bản bài báo trên Nature có tên “Solving olympiad geometry without human demonstrations” https://www.nature.com/articles/s41586-023-06747-5. Mã nguồn tại đây https://github.com/google-deepmind/alphageometry. Mô hình có tên là AlphaGeometry được huấn luyện trên synthetic data và có thể giải được các bài toán trong các kì thi Olympic Toán học quốc tế hàng năm. Trong 30 đề thi gần nhất, AlphaGeometry giải được 25 đề với điểm số đạt được điểm số trung bình của nhóm đạt huy chương vàng.
AlphaGeometry rất thú vị vì nó kết hợp sức mạnh dự đoán của mô hình ngôn ngữ thần kinh với một công cụ suy luận tuân theo quy tắc, hoạt động song song để tìm ra giải pháp.
AlphaGeometry áp dụng cách tiếp cận biểu tượng thần kinh
AlphaGeometry là một hệ thống ký hiệu thần kinh được tạo thành từ mô hình ngôn ngữ thần kinh và công cụ suy luận ký hiệu, chúng phối hợp với nhau để tìm ra bằng chứng cho các định lý hình học phức tạp. Tương tự như ý tưởng “tư duy, nhanh và chậm”, một hệ thống cung cấp những ý tưởng nhanh chóng, “trực quan” và hệ thống kia đưa ra quyết định hợp lý, có chủ ý hơn.
Mô hình ngôn ngữ của AlphaGeometry hướng dẫn công cụ suy luận ký hiệu của nó hướng tới các giải pháp khả thi cho các vấn đề hình học. Các bài toán hình học Olympic dựa trên các sơ đồ cần bổ sung các cấu trúc hình học mới trước khi có thể giải được, chẳng hạn như điểm, đường thẳng hoặc đường tròn. Mô hình ngôn ngữ của AlphaGeometry dự đoán những cấu trúc mới nào sẽ hữu ích nhất để thêm vào, từ vô số khả năng. Những manh mối này giúp lấp đầy những khoảng trống và cho phép công cụ biểu tượng đưa ra những suy luận sâu hơn về sơ đồ và đưa ra giải pháp.
AlphaGeometry tạo 100 triệu ví dụ dữ liệu tổng hợp
Hình học dựa trên sự hiểu biết về không gian, khoảng cách, hình dạng và vị trí tương đối, đồng thời là nền tảng của nghệ thuật, kiến trúc, kỹ thuật và nhiều lĩnh vực khác. Con người có thể học hình học bằng bút và giấy, kiểm tra sơ đồ và sử dụng kiến thức hiện có để khám phá các mối quan hệ và tính chất hình học mới, phức tạp hơn. Phương pháp tạo dữ liệu tổng hợp của chúng tôi mô phỏng quá trình xây dựng kiến thức này trên quy mô lớn, cho phép chúng tôi đào tạo AlphaGeometry từ đầu mà không cần bất kỳ sự minh họa nào của con người.
Sử dụng tính toán song song cao, hệ thống bắt đầu bằng cách tạo ra một tỷ sơ đồ ngẫu nhiên của các đối tượng hình học và rút ra một cách thấu đáo tất cả mối quan hệ giữa các điểm và đường trong mỗi sơ đồ. AlphaGeometry đã tìm thấy tất cả các bằng chứng có trong mỗi sơ đồ, sau đó làm việc ngược lại để tìm ra những cấu trúc bổ sung nào, nếu có, là cần thiết để đi đến những bằng chứng đó. Chúng tôi gọi quá trình này là “khấu trừ tượng trưng và truy nguyên”.
Nhóm dữ liệu khổng lồ đó đã được lọc để loại trừ các ví dụ tương tự, dẫn đến tập dữ liệu đào tạo cuối cùng gồm 100 triệu ví dụ duy nhất có độ khó khác nhau, trong đó có 9 triệu cấu trúc được bổ sung đặc trưng. Với rất nhiều ví dụ về cách các cấu trúc này dẫn đến chứng minh, mô hình ngôn ngữ của AlphaGeometry có thể đưa ra những gợi ý hữu ích cho các cấu trúc mới khi trình bày các bài toán hình học Olympic.
Tiên phong suy luận toán học với AI
Lời giải của mọi bài toán Olympic do AlphaGeometry cung cấp đều được máy tính kiểm tra và xác minh. Chúng tôi cũng so sánh kết quả của nó với các phương pháp AI trước đây và với thành tích của con người tại Olympic. Ngoài ra, Evan Chen, huấn luyện viên toán và từng đoạt huy chương vàng Olympic, đã đánh giá một số giải pháp của AlphaGeometry cho chúng tôi.
Chen cho biết: “Kết quả của AlphaGeometry rất ấn tượng vì nó vừa có thể kiểm chứng vừa rõ ràng. Các giải pháp AI trước đây cho các vấn đề cạnh tranh dựa trên bằng chứng đôi khi không thành công (kết quả đầu ra đôi khi chỉ chính xác và cần có sự kiểm tra của con người). AlphaGeometry không có điểm yếu này: các giải pháp của nó có cấu trúc có thể xác minh được bằng máy. Tuy nhiên, bất chấp điều này, đầu ra của nó vẫn có thể đọc được. Người ta có thể tưởng tượng ra một chương trình máy tính có thể giải các bài toán hình học bằng các hệ tọa độ cưỡng bức: suy nghĩ các trang và các trang tính toán đại số tẻ nhạt. AlphaGeometry không phải vậy. Nó sử dụng các quy tắc hình học cổ điển với các góc và các hình tam giác giống nhau giống như học sinh làm.”
Tổng hợp từ https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/