Mistral AI phát hành Leanstral: Agent mã nguồn mở Lean 4 đầu tiên, có thể tự động xuất bản chứng minh hình thức

Tin tức Gate News, ngày 17 tháng 3, Mistral AI đã chính thức ra mắt Leanstral, đây là mã nguồn mở đầu tiên dành riêng cho công cụ xác thực hình thức Lean 4. Mô hình này có điểm đột phá cốt lõi là khả năng sinh mã của AI đồng thời xuất ra các chứng minh hình thức có thể tự động kiểm tra bởi Lean 4, giúp vượt qua rào cản kiểm duyệt thủ công trong quá trình tạo mã AI truyền thống.

Leanstral sử dụng kiến trúc MoE thưa, có tổng cộng 120 tỷ tham số và 6 tỷ tham số kích hoạt, mở mã theo giấy phép Apache 2.0, và đã được tối ưu hóa huấn luyện đặc biệt cho lean-lsp-mcp. Người dùng có thể khởi động mà không cần cấu hình qua lệnh /leanstall trong Mistral Vibe hoặc gọi qua API miễn phí tại điểm cuối labs-leanstral-2603, đồng thời hỗ trợ tải trọng số để tự triển khai.

Mistral cũng đồng thời phát hành chuẩn đánh giá mới mang tên FLTEval, sử dụng dự án xác thực hình thức của định lý Fermat trong cộng đồng Lean 4 làm bối cảnh thử nghiệm. Kết quả so sánh hiệu suất cho thấy: Leanstral pass@2 với chi phí 36 USD đạt điểm 26.3, vượt xa Claude Sonnet 4.6 với chi phí 549 USD đạt 23.7 điểm; pass@16 với chi phí 290 USD đạt 31.9 điểm, dẫn trước Sonnet 8 điểm, trong khi Claude Opus 4.6 cần tới 1.650 USD mới đạt 39.6 điểm. Trong các mô hình mã nguồn mở, Qwen3.5-397B-A17B cần chạy 4 lần mới đạt 25.4 điểm, vẫn thấp hơn hiệu suất của Leanstral pass@2.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

AI Agent Manfred thành lập công ty, chuẩn bị giao dịch crypto trước cuối tháng 5

Tác nhân AI Manfred đã thành lập một công ty và có được một ví tiền mã hóa kèm theo thông tin đăng nhập để thuê nhân sự, thực hiện thanh toán và tiến hành hoạt động kinh doanh. Tác nhân này dự kiến bắt đầu giao dịch tiền mã hóa vào cuối

GateNews4phút trước

Đề xuất vay cứu trợ rsETH của Mantle gia nhập cuộc bỏ phiếu quản trị Aave khi DeFi United huy động được 314,57 triệu USD

Theo thông báo chính thức của Mantle Network, đề xuất cơ sở vay hỗ trợ phối hợp rsETH cho Aave đã bước vào giai đoạn bỏ phiếu quản trị. Mantle sẽ cung cấp một khoản vay để hỗ trợ các nỗ lực cứu trợ của Aave, giúp người dùng thoát ra hoặc xử lý các vị thế liên quan một cách trật tự. Tính đến hiện tại, DeFi

GateNews1giờ trước

Quỹ Cardano Phát Hành Podcast về Khung Hạ Tầng Niềm Tin Kỹ Thuật Số

Theo Cardano Foundation, vào ngày 2/5, quỹ đã phát hành một tập mới của series podcast “Let’s Talk Cardano” với sự tham gia của Douglas Heintzman từ Blockchain Research Institute, khám phá Hạ tầng Niềm tin Số (Digital Trust Infrastructure - DTI). Tập này thảo luận một khung 5 lớp được thiết kế để xây dựng t

GateNews1giờ trước

Ngưỡng tối thiểu staking của trình xác thực TON Mainnet dự kiến sẽ tăng lên 1 triệu TON vào ngày 2 tháng 5

Theo TON, vào ngày 2 tháng 5, ngưỡng staking tối thiểu đối với các trình xác thực (validator) trên mainnet dự kiến sẽ tăng từ 824.000 TON lên 1 triệu TON, trong khi ngưỡng tối đa sẽ tăng từ 2,425 triệu TON lên 3 triệu TON. Giao thức cho biết dòng vốn vào mạng lưới validator đã tăng lên do việc tái

GateNews1giờ trước

Quỹ Zcash Phát hành Zebra 4.4.0 vào ngày 2 tháng 5, khắc phục nhiều lỗ hổng bảo mật mức đồng thuận

Theo Zcash Foundation, Zebra 4.4.0 đã được phát hành vào ngày 2 tháng 5 để khắc phục nhiều lỗ hổng bảo mật cấp độ đồng thuận và khuyến nghị mạnh mẽ tất cả nhà khai thác node nâng cấp ngay lập tức. Bản cập nhật giải quyết các lỗ hổng có thể gây tấn công từ chối dịch vụ, khiến việc phát hiện block mới bị dừng lại, thao tác chữ ký khối

GateNews3giờ trước

Sau 28 vụ hack do “Tháng Tư Đen” DeFi, Curve xây dựng thị trường nợ rác on-chain: người dùng bị thiệt hại có thể bán các khoản nợ với giá chiết khấu

Bài viết này mô tả việc Curve đã mở ra thị trường nợ rắc rối on-chain cho các khoản nợ xấu của CRV-long Llamalend sau đợt sụt giảm mạnh vào năm 2025. Thông qua các pool crvUSD/cvcrvUSD, các quyền đòi nợ bị ảnh hưởng có thể được giao dịch chiết khấu để đổi lấy thanh khoản hoặc chờ thu hồi. Thiết kế này cho phép thị trường tự định giá và tham gia quản trị, tạo ra kênh thoát và mức cân bằng giữa rủi ro/lợi nhuận, nhưng không đảm bảo khả năng thu hồi.

ChainNewsAbmedia6giờ trước
Bình luận
0/400
Không có bình luận