Vì sao có người nghĩ AI sẽ thay đổi thế giới, còn người khác lại cho rằng chỉ bình thường? Hai nhận định của Karpathy

ChainNewsAbmedia

Andre j Karpathy — người đồng sáng lập đội ngũ của OpenAI, cựu giám đốc AI tại Tesla — đã đăng trên X một bài viết dài về “khoảng cách nhận thức năng lực AI”, trả lời một hiện tượng trong cộng đồng: mức độ kinh ngạc với AI bị chia đôi—một nhóm cho rằng AI đã viết lại thế giới, nhóm khác lại nghĩ AI chỉ biết bịa chuyện, nhàm chán, và bị thổi phồng quá đà. Karpathy đưa ra hai chẩn đoán, giải thích vì sao hai nhóm người này giống “hai thế giới song song”, và họ đã hiểu sai các căn cứ phán đoán của nhau. Bài viết dưới đây tổng hợp các luận điểm của ông và rút ra gợi ý cho độc giả công nghệ tại Đài Loan.

Chẩn đoán 1: Bạn đang dùng loại AI nào—thuộc năm nào, và thuộc “tầng” nào?

Quan sát đầu tiên của Karpathy rất thẳng và sắc bén: “Rất nhiều người năm ngoái dùng thử bản miễn phí của ChatGPT, và trải nghiệm đó đã định hình cách họ nhìn về AI.” Phản ứng của nhóm này thường là chế nhạo những hành vi kỳ lạ của mô hình, ảo giác, sự vụng về, và những video lan truyền rằng việc chuyển OpenAI sang chế độ giọng nói nâng cao đã bị lật kèo vì những câu hỏi đơn giản kiểu “Tôi nên lái xe đi rửa xe hay đi bộ”.

Nhưng Karpathy chỉ ra: những mô hình “bản miễn phí, bản cũ, bản bị ngừng dùng” đó hoàn toàn không phản ánh được năng lực của các mô hình agentic tiên tiến nhất vào năm 2026 (đặc biệt là OpenAI Codex và Claude Code). Nói đơn giản: bạn đem ChatGPT miễn phí năm 2024 để phán AI có viết được code hay không, chẳng khác nào đem Nokia E71 năm 2008 để đánh giá một chiếc smartphone có dùng được hay không.

Với nhiều độc giả Đài Loan, đây cũng là chuyện rất thực tế—việc đăng ký ChatGPT Plus (20 USD) vẫn khá phổ biến, nhưng người đăng ký ChatGPT Pro (200 USD), Claude Max (100 USD) thì rất hiếm. Nếu chưa từng chạy agent task ở các tier trả phí cao nhất, bạn sẽ thấy AI chủ yếu là “đồ chơi hay ho nhưng không đáng tin”; còn nếu đã chạy qua, bạn sẽ thấy AI là “cải viết lại toàn bộ quy trình làm việc”. Cùng một công nghệ, nhưng hai thế giới.

Chẩn đoán 2: Tiến bộ năng lực ở các lĩnh vực khác nhau là “bất đối xứng”

Chẩn đoán thứ hai của Karpathy còn thú vị hơn: “Dù bạn trả 200 USD mỗi tháng để dùng mô hình tiên tiến nhất, thì tiến bộ năng lực vẫn mang tính ‘đột phá theo đỉnh’, tập trung vào những lĩnh vực kỹ thuật cao.”

Ông chỉ ra: tìm kiếm, viết lách, gợi ý—những thứ kiểu “truy vấn điển hình” như vậy—không phải là lĩnh vực mà tiến bộ của AI trong vài năm gần đây diễn ra mạnh nhất. Có hai lý do:

Học tăng cường (RL) phụ thuộc vào hàm thưởng có thể kiểm chứng—viết code có tín hiệu rõ ràng kiểu “bài unit test đã pass”, còn viết lách không có tiêu chuẩn khách quan tương ứng, nên tốc độ chênh lệch của RL rất lớn

Giá trị kinh doanh lớn nhất của các công ty như OpenAI, Anthropic nằm ở các bối cảnh B2B về code/research/engineering, nên nguồn lực, nhân lực, và ưu tiên đều dồn vào các lĩnh vực đó; các use case khác không phải là nguồn sinh lợi nhuận tối đa

Nhận định này rất quan trọng—nó giải thích vì sao “AI viết code thì nhảy vọt, nhưng AI viết bài vẫn thường bình thường” lại là một hiện tượng khiến nhiều người bối rối. Không phải vì các công ty AI không làm được, mà là mỏ vàng của họ nằm ở chỗ khác, và sự chú ý cũng đi theo.

Ai chịu “cú sốc nhận thức AI” mạnh nhất? Hai điều kiện phải đồng thời thỏa

Gộp hai chẩn đoán lại, Karpathy mô tả nhóm “bị cú sốc nhận thức AI” nhiều nhất—những người đồng thời thỏa hai điều kiện:

Dùng các mô hình agentic tiên tiến nhất theo hình thức trả phí (OpenAI Codex, Claude Code)

Sử dụng chuyên sâu trong các lĩnh vực kỹ thuật cao (lập trình, toán học, nghiên cứu)

Nhóm này bị tác động mạnh bởi cái gọi là “AI Psychosis”—cách dùng từ của Karpathy—để mô tả cảm giác khi bạn tận mắt thấy LLM giải quyết các bài toán lập trình trước đó phải mất vài ngày đến vài tuần chỉ trong vài giờ: những phán đoán về năng lực AI và độ dốc (slope) sẽ khiến bạn có cái nhìn hoàn toàn khác về cục diện công nghệ trong vài năm tới.

Đối với nhóm người còn lại (không trả phí, không dùng trong lĩnh vực kỹ thuật), những lời như vậy nghe giống kiểu “quá phấn khích”, giống “ảo tưởng của nhóm nhỏ ở Silicon Valley”. Nhưng Karpathy cho rằng đó không phải ảo tưởng, mà là phán đoán thật dựa trên trải nghiệm cá nhân.

Hai nhóm “nói về thế giới của nhau”, chứ không nói chuyện với nhau

Kết luận cốt lõi của Karpathy: “Hai nhóm này nói với nhau về những gì họ thấy, chứ không phải nói với nhau.” Ông mô tả có thể cùng lúc đúng hai chuyện:

Chế độ giọng nói nâng cao của OpenAI miễn phí (và theo tôi là bị bán khai/đình trệ một phần), trên Instagram Reels sẽ làm trẹo những câu hỏi ngớ ngẩn nhất

Trong khi đó, mô hình Codex ở tier trả phí cao nhất của OpenAI sẽ dành khoảng 1 giờ để tái cấu trúc toàn bộ codebase một cách mạch lạc, hoặc tìm ra và tận dụng các lỗ hổng của hệ thống máy tính

Hai chuyện đều đúng, không mâu thuẫn. Nhưng hai nhóm chỉ thấy một phần, rồi nhìn nhau và cho rằng đối phương “quá hưng phấn” hoặc “quá thiếu hiểu biết”. Mục đích của bài viết này là bắc cầu cho khoảng cách đó.

Gợi ý cho độc giả Đài Loan: bạn thuộc nhóm nào?

Luận điểm của Karpathy đặc biệt có ý nghĩa với độc giả Đài Loan, vì ngay trong diễn đàn công nghệ Đài Loan cũng có sự phân cực tương tự: một bên là “AI đã tiếp quản”, bên kia là “chỉ là chatbot thôi”. Xác định bạn thuộc nhóm nào có thể dựa vào 3 câu hỏi tự vấn:

Lần gần đây nhất bạn tự tay đưa prompt cho mô hình tiên tiến trả phí (GPT-5.5 Pro, Claude Opus 4.7) là khi nào?

Bạn có để agent chạy hơn 30 phút và thực sự hoàn thành một tác vụ cấp sản xuất (tái cấu trúc code, viết tổng quan nghiên cứu, debug một hệ thống phức tạp) hay chưa?

Căn cứ bạn dùng để đánh giá năng lực AI đến từ báo chí, meme cộng đồng, hay từ trải nghiệm tự dùng?

Nếu bạn trả lời “có, gần đây, dùng trực tiếp” cho cả ba câu hỏi, thì bạn sẽ rơi vào nhóm thứ hai như Karpathy mô tả, và có thể hiểu tốt hơn cách ông nói về “AI Psychosis”. Nếu bạn trả lời “không, đã rất lâu, xem trên truyền thông” cho cả ba câu hỏi, thì bạn sẽ rơi vào nhóm đầu tiên và có thể đánh giá thấp đáng kể tốc độ tiến bộ của AI.

Không phải nói nhóm nào “đúng”, mà là nền tảng căn cứ phán đoán của các nhóm khác nhau là khác biệt mang tính căn bản. Khi bạn đọc bài tiếp theo kiểu “AI là bong bóng” hoặc “AI sẽ thay thế mọi công việc”, hãy kiểm tra trước tác giả thuộc nhóm nào, rồi mới quyết định cách đọc.

Bổ sung: “Khoảnh khắc OpenClaw” của Karpathy

Trong các bài đăng tiếp theo, Karpathy bổ sung: “Có người gần đây nói với tôi rằng, khoảnh khắc OpenClaw lại lớn như vậy vì đây là một nhóm người không có nền tảng kỹ thuật, và lần đầu tiên họ tự trải nghiệm các mô hình agentic tiên tiến.” Nhận định này cho thấy: khoảng cách nhận thức không chỉ là khác nhau về mức độ, mà còn là khác nhau giữa “trải nghiệm trực tiếp” và “nghe truyền miệng”.

Với độc giả abmedia, cách làm thực dụng nhất là: chi 20 USD, đăng ký ChatGPT Plus hoặc Claude Pro trong 1 tháng, chọn một tác vụ thực tế mà bạn thật sự quan tâm (viết một báo cáo nghiên cứu, tổng hợp một phân tích tài chính, debug một dự án code), cho agent chạy trọn vẹn, rồi quay lại đánh giá ý nghĩa của AI đối với công việc của bạn. Làm vậy còn hữu ích hơn đọc 100 bài tin tức về AI.

Bài viết này: Vì sao có người thấy AI thay đổi thế giới, có người lại thấy nó bình thường? Hai chẩn đoán của Karpathy lần đầu tiên xuất hiện tại chuỗi tin tức ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Cursor chấp nhận lời đề nghị mua lại 60 tỷ USD của SpaceX nhưng sẽ không hợp tác với xAI về các mô hình lập trình

Theo The Information, Cursor đã chấp nhận một đề nghị mua lại trị giá 60 tỷ USD từ SpaceX theo điều kiện, dù thương vụ hiện vẫn chưa được hoàn tất. Công ty hiện không có kế hoạch hợp tác với đơn vị AI của SpaceX là xAI để phát triển các mô hình lập trình. Thay vào đó, Cursor đang tập trung vào việc tối ưu hóa nó

GateNews20phút trước

Haun Ventures đóng quỹ 1 tỷ USD vào ngày 4/5, phân bổ vốn giữa các khoản đầu tư crypto giai đoạn đầu và giai đoạn muộn

Theo Bloomberg, Haun Ventures đã hoàn tất một vòng gọi vốn trị giá 1 tỷ USD vào ngày 4/5, với 500 triệu USD dành cho đầu tư giai đoạn đầu và 500 triệu USD cho các khoản đầu tư giai đoạn sau. Quỹ sẽ triển khai vốn trong 2 đến 3 năm tới, nhắm vào các startup tiền mã hóa và blockchain, đồng thời mở rộng

GateNews43phút trước

OpenAI huy động $4 tỷ để triển khai liên doanh, định giá 10 tỷ USD

Theo BlockBeats, vào ngày 4 tháng 5, OpenAI đã huy động hơn $4 tỷ USD để thành lập một công ty liên doanh mới nhằm hỗ trợ doanh nghiệp ứng dụng phần mềm trí tuệ nhân tạo của mình. Công ty liên doanh này, có tên là The Deployment Company, được hậu thuẫn bởi 19 nhà đầu tư bao gồm TPG Inc., Brookfield Asset Management,

GateNews1giờ trước

Applied Digital đảm bảo khoản tài trợ cầu trị giá 300 triệu USD do Goldman Sachs dẫn đầu cho các trung tâm dữ liệu AI

Theo Globenewswire, Applied Digital đã huy động 300 triệu USD trong khoản tài trợ cầu (bridge) cấp cao có bảo đảm, do Goldman Sachs dẫn dắt, vào ngày 4/5, nhằm thúc đẩy việc phát triển trung tâm dữ liệu AI của công ty. Khoản tài trợ được bảo đảm bằng các tài sản dự án, có thể thanh toán trước hạn mà không bị phạt, và công ty dự kiến sẽ tiếp tục theo đuổi

GateNews1giờ trước

Karpathy: “Để LLM tự phản biện”: 4 bước dùng AI để chống lại các thiên lệch trong suy nghĩ

Bài viết này tóm tắt “phương pháp 4 bước để LLM phản biện lại lập luận của chính nó” của Andrej Karpathy: trước tiên dùng LLM để mài giũa bản nháp; sau đó bắt đầu một cuộc đối thoại mới, yêu cầu nó đưa ra các luận điểm phản đối và kèm bằng chứng; tiếp theo viết thành một bài phản biện hoàn chỉnh; cuối cùng đối chiếu hai phía và các bằng chứng có thể kiểm chứng, để con người đánh giá. Lưu ý rằng LLM có thể “dễ nịnh theo ý người” (sycophancy), không nên coi sự đồng ý là chân lý—hãy xem nó như một cỗ máy tạo luận điểm chứ không phải trọng tài ra phán quyết kết luận; cũng có thể cho hai LLM tranh luận với nhau để giảm thiên kiến. Phương pháp này đặc biệt có giá trị trong sáng tạo nội dung năm 2026, giúp tăng chiều sâu nhận thức và giảm tính đồng chất.

ChainNewsAbmedia1giờ trước

Sam Altman và Dario Amodei đều quá khó ưa! Luận điệu tận thế của AI và cảm giác tương đối bị tước đoạt khiến người dân Mỹ ngày càng phản cảm với AI

Podcast nổi tiếng của Silicon Valley《All-In Podcast》khi thảo luận về ngành công nghiệp AI đã đưa ra một nhận xét khá sắc bén: thái độ của xã hội Mỹ đối với AI đang chuyển dần sang tiêu cực, và đối tượng xả giận cụ thể nhất chính là các trung tâm dữ liệu mà các công ty AI đang gấp rút xây dựng ở khắp nơi trên toàn nước Mỹ. Nguồn gốc của sự phản cảm này có thể bao gồm thuyết tận thế AI, nỗi sợ mất việc, hoặc một sự bất mãn sâu xa hơn: làn sóng đổi mới công nghệ mới dường như lại chỉ giúp một nhóm ít người giàu nhanh, trong khi cuộc sống của đa số lại không có cải thiện rõ rệt. Tại Mỹ, một số chính quyền địa phương đã lật lại các vụ việc xây dựng trung tâm dữ liệu Chamath Palihapitiya cho biết trong chương trình rằng những vấn đề mà ngành công nghiệp AI đang đối mặt hiện nay không chỉ là cạnh tranh mô hình, chi tiêu vốn hay tình trạng thiếu năng lực tính toán, mà là “người dân Mỹ nhìn chung đang ngày càng phản cảm với câu chuyện AI”. Ông chỉ ra rằng nguồn gốc của sự phản cảm này có thể bao gồm AI

ChainNewsAbmedia3giờ trước
Bình luận
0/400
Không có bình luận