Xin chào một lần nữa và chào mừng trở lại Công ty nhanh‘S Đã cắm vào.
Một bài đăng trên blog ngày 9 tháng 2 về AI, có tựa đề “Điều gì đó lớn lao đang xảy ra”, đã lan truyền khắp mạng trong tuần này theo cách khiến tôi nhớ lại thời kỳ hoàng kim của thế giới blog. Mọi người dường như đang nói về nó – mặc dù điều này thường đúng vào thời đó, tính lan truyền của nó được thúc đẩy bởi một loại cocktail mạnh mẽ của sự tôn thờ và khinh miệt. Các phản ứng bao gồm từ “Gửi cái này cho những người bạn quan tâm” đến “Tôi hoàn toàn không mua cái này”.
Tác giả, Matt Shumer (người đã chia sẻ bài đăng của mình trên X vào ngày hôm sau), là Giám đốc điều hành của một công ty khởi nghiệp có tên OthersideAI. Anh ấy giải thích rằng anh ấy đang gửi nó cho “gia đình tôi, bạn bè tôi, những người tôi quan tâm, những người luôn hỏi tôi ‘vậy vấn đề với AI là gì?’ và nhận được một câu trả lời không công bằng với những gì đang thực sự xảy ra.”
Theo Shumer, thỏa thuận với AI là các mẫu mới nhất—cụ thể là GPT-5.3 Codex của OpenAI và Claude Opus 4.6 của Anthropic—là những cải tiến căn bản trên mọi thứ có trước chúng. Và AI đó đột nhiên có khả năng viết mã tốt đến mức toàn bộ ngành công nghệ phần mềm đã bước vào một kỷ nguyên mới. Và AI đó sẽ sớm vượt trội hơn con người trong công việc cốt lõi của một loạt ngành nghề khác: “Luật, tài chính, y học, kế toán, tư vấn, viết lách, thiết kế, phân tích, dịch vụ khách hàng”.
Đến cuối bài, với cảm giác nghẹt thở khiến tôi nhớ đến những kẻ tiên đoán lỗi Y2K năm 1999, Shumer đang khuyên độc giả nên tiết kiệm, giảm thiểu nợ nần và có thể khuyến khích con cái họ trở thành phù thủy AI thay vì tập trung vào đại học với kỳ vọng nó sẽ dẫn đến một sự nghiệp vững chắc. Ông ngụ ý rằng bất kỳ ai không vượt lên trước AI trong sáu tháng tới đều có thể rơi vào tình trạng không còn phù hợp.
Đoạn—mà Shumer đã kể New Yorkcủa Benjamin Hart mà anh ấy viết với sự hỗ trợ dồi dào từ AI—không phải là không có điểm. Một số người chê bai AI vào lúc này chắc chắn sẽ ngạc nhiên trước tác động của nó đối với công việc và cuộc sống trong những năm tới, đó là lý do tại sao tôi chân thành tán thành khuyến nghị của Shumer rằng mọi người nên hiểu rõ hơn về công nghệ này bằng cách dành một giờ mỗi ngày để mày mò về nó. Nhiều người thông minh ở Thung lũng Silicon chia sẻ sự kinh ngạc của Shumer trước bước nhảy vọt vượt bậc gần đây của AI về kỹ năng viết mã, điều mà tôi đã viết vào tuần trước. Tự hỏi điều gì sẽ xảy ra nếu nó được nhân rộng trong các lĩnh vực khác là một bài tập tinh thần hoàn toàn hợp lý.
Tuy nhiên, cuối cùng, Shumer sẽ có một trường hợp tốt hơn nhiều nếu anh ta ít hơn 70% so với người dẫn đầu. (Tôi nên lưu ý rằng lần cuối cùng anh ấy xuất hiện trên bản tin là việc đưa ra những tuyên bố liên quan đến hiệu suất chuẩn của một mô hình AI mà anh ấy tham gia hóa ra không phải sự thật.) Bài đăng của anh ấy mắc phải một lỗ hổng phổ biến trong cuộc trò chuyện về AI: Công nghệ quá kinh ngạc đến mức nó từ chối thừa nhận những hạn chế nghiêm trọng mà nó vẫn tồn tại.
Ví dụ, Shumer gợi ý rằng ảo giác—AI xâu chuỗi các chuỗi từ nghe có vẻ thực tế nhưng không phải—là một vấn đề đã được giải quyết. Anh ấy viết rằng vài năm trước, ChatGPT “tự tin nói những điều vô nghĩa” và rằng “trong thời AI, đó là lịch sử cổ đại”.
Đúng là những mẫu xe mới nhất không hề gây ảo giác với bất cứ điều gì giống như việc bỏ rơi những mẫu xe tiền nhiệm. Nhưng họ vẫn bịa ra chuyện. Và không giống như các mô hình trước đó, ảo giác của chúng có xu hướng nghe có vẻ hợp lý hơn là lố bịch một cách rõ ràng, đó là một bước đi sai hướng.
Cùng ngày tôi đọc bài viết của Shumer, tôi đã trò chuyện với Claude Opus 4.6 về truyện tranh trên báo—một chủ đề tôi thường sử dụng để đánh giá AI vì tôi biết đủ về nó để đánh giá phản hồi một cách nhanh chóng—và đó là kinh khủng. kinh khủng về việc liên kết các họa sĩ truyện tranh với những tác phẩm mà họ thực sự đã thực hiện. Chúng ta càng nói nhiều thì nó càng kém chính xác. Ít nhất thì nó cũng rất xuất sắc trong việc khuyến khích những sai sót của mình: Khi tôi chỉ ra một lỗi, nó nói với tôi: “Về cơ bản, tôi đã có những mảnh thông tin thực được trộn lẫn với nhau và trình bày với sự tự tin sai lầm. Không hay lắm.”
Sau khi giải quyết một câu hỏi khác liên quan đến truyện tranh của tôi, Claude nói, “Tôi thực sự đang đi vào lãnh thổ không ổn định ở đây và trộn lẫn một số chi tiết,” và yêu cầu tôi giúp điều khiển nó đi đúng hướng. Đó là một tia hấp dẫn về sự tự nhận thức về xu hướng mơ mộng và sự tiến bộ của chính nó. Nhưng cho đến khi AI ngừng nói chuyện, việc mô tả nó “thông minh hơn hầu hết các tiến sĩ” như Shumer đã nói, là điều ngớ ngẩn. (Tôi tiếp tục tin rằng khả năng của con người không phải là tiêu chuẩn tuyệt vời cho AI, vốn đã tốt hơn chúng ta ở một số lĩnh vực và có thể bị tụt hậu vĩnh viễn ở những lĩnh vực khác.)
Shumer cũng đi trước chính mình trong các giả định của mình về vị trí của AI trong tương lai ngắn hạn khi có khả năng thay thế suy nghĩ và lao động của con người một cách thành thạo. Viết về các loại nhiệm vụ công việc phức tạp mà ông khuyên nên sử dụng AI như một thử nghiệm, ông nói: “Nếu nó thậm chí còn loại hoạt động hôm nay, bạn có thể gần như chắc chắn rằng trong sáu tháng nữa nó sẽ hoạt động gần như hoàn hảo.” Điều đó dường như cực kỳ khó xảy ra vì tất cả các loại AI có thể tạo ra đều bị mắc kẹt trong “loại-of-works” trong nhiều năm nay. Một nguyên tắc nhỏ: Đừng tin rằng AI sẽ có thể làm tốt điều gì đó cho đến khi nó thực sự làm được.
Cuối cùng, điều rút ra từ bài viết của Shumer mà tôi nhớ nhất không phải là những gì anh ấy viết. Trên tinh thần thử nghiệm AI, tôi đã đưa tác phẩm của anh ấy cho ChatGPT, Gemini và Claude với lời nhắc “Hãy cho tôi một phân tích/phê bình về bài luận này. Hãy cho tôi biết liệu nó có quá thận trọng, không đủ thận trọng hay không, quan điểm của bạn về các chủ đề được thảo luận, v.v.” Tôi đã chuẩn bị sẵn sàng để tất cả họ trả lời bằng một điều gì đó đơn giản nhưng nông cạn, một bản tóm tắt ngắn gọn hơn bất cứ điều gì. ChatGPT và Gemini đã đáp ứng được những kỳ vọng đó.
Tuy nhiên, việc Claude chuyển sang chủ đề này – nó xuất hiện trong vài giây và bạn có thể đọc toàn bộ ở đây – đã khiến tôi bắt đầu. Nó có vấn đề với một số điều tương tự về tác phẩm khiến tôi khó chịu nhưng cũng nêu ra những điểm yếu khác mà tôi chưa tính đến. Tôi cảm thấy thông minh hơn sau khi đọc nó, đây vẫn không phải là điều tôi mong đợi từ văn xuôi AI.
Một vài cốm:
Mã hóa là một lĩnh vực đặc biệt thuận lợi cho AI – đầu ra có thể kiểm chứng được, vòng phản hồi chặt chẽ, dữ liệu đào tạo dồi dào và môi trường hoàn toàn kỹ thuật số. Nghề luật, y học và quản lý liên quan đến sự mơ hồ, bối cảnh thể chế, mối quan hệ con người, trách nhiệm giải trình theo quy định và động lực đối nghịch khác nhau về mặt chất lượng. Anh ấy thừa nhận điều này một cách ngắn gọn và sau đó xua nó đi.
….
Có, nhiều người đã thử GPT-3.5 và loại bỏ toàn bộ lĩnh vực này. Đó là một vấn đề thực sự. Nhưng nhiều người dùng hiện tại, nghiêm túc – bao gồm cả những người trả tiền cho những mô hình tốt nhất – vẫn gặp phải những hạn chế đáng kể: ảo giác (giảm nhưng không loại bỏ), dễ hiểu về các vấn đề mới, không có khả năng duy trì bối cảnh mạch lạc trong các dự án thực sự dài, hiệu chỉnh kém về tính không chắc chắn của chính nó và khó khăn với các nhiệm vụ đòi hỏi nền tảng trong thế giới thực. Shumer coi mọi chủ nghĩa hoài nghi là lỗi thời, thiếu trung thực về mặt trí tuệ.
….
Anh ấy cũng không nghiêm túc quan tâm đến khả năng các động lực kinh tế có thể không diễn ra suôn sẻ như “AI có thể thực hiện công việc, do đó công việc sẽ biến mất”. Xung đột trong việc áp dụng là có thật. Những lo ngại về trách nhiệm pháp lý là có thật. Sức ì của tổ chức là có thật. Lịch sử công nghệ cho thấy rằng ngay cả các công cụ chuyển đổi cũng mất nhiều thời gian hơn để tái cơ cấu các ngành so với mốc thời gian về năng lực thuần túy gợi ý. Điện phải mất hàng thập kỷ để định hình lại ngành sản xuất ngay cả khi nó rõ ràng vượt trội hơn hơi nước.
…
Tôi nghĩ tín hiệu cơ bản mà Shumer đang chỉ tới là có thật. Khả năng của AI đang được cải thiện nhanh hơn mức mà hầu hết mọi người ngoài ngành đánh giá cao và khoảng cách giữa nhận thức của công chúng và thực tế hiện tại là thực sự lớn. Anh ấy đúng khi cho rằng hầu hết mọi người nên sử dụng những công cụ này một cách nghiêm túc hơn.
Nhưng tôi nghĩ bài luận đang làm một việc rất phổ biến ở Thung lũng Silicon: nhầm lẫn tiềm năng. tiềm năng quỹ đạo cho tất yếu quỹ đạo và nén các mốc thời gian dựa trên rung cảm và phép ngoại suy thay vì vật lộn nghiêm túc với nhiều xung đột trong thế giới thực làm chậm quá trình áp dụng. Đoạn văn này có vẻ như được viết ngay sau khi bị ấn tượng bởi một phiên bản mẫu mới – và những khoảnh khắc đó có xu hướng tạo ra sự tự tin thái quá về tốc độ.
Tóm lại: Trong cùng ngày tôi thấy Claude Opus 4.6 viết điều gì đó về tác phẩm của Shumer không chỉ mạch lạc mà còn sâu sắc, nó còn biến thành một cơn ảo giác. AI ngày nay là như vậy: vừa tuyệt vời vừa khủng khiếp. Bằng cách nào đó, thực tế đó khó được nhiều nhà quan sát chấp nhận. Nhưng bất kỳ phân tích nào bỏ qua nó đều có nguy cơ đánh giá sai điều gì sẽ xảy ra tiếp theo.
Bạn đã đọc Đã cắm vào, Công ty nhanh chóngbản tin công nghệ hàng tuần từ tôi, biên tập viên công nghệ toàn cầu Harry McCracken. Nếu một người bạn hoặc đồng nghiệp đã chuyển tiếp ấn bản này cho bạn—hoặc nếu bạn đang đọc nó trên fastcompany.com—bạn có thể xem các số trước đó và đăng ký để tự mình nhận ấn bản này vào mỗi sáng thứ Sáu. Tôi rất mong nhận được phản hồi từ bạn: Hãy liên hệ với tôi theo địa chỉ hmccracken@fastcompany.com với phản hồi và ý tưởng của bạn cho các bản tin trong tương lai. Tôi cũng sử dụng Bluesky, Mastodon và Threads và bạn có thể theo. theo Đã cắm vào trên Flipboard.
Thêm những câu chuyện công nghệ hàng đầu từ Fast Company
Các nhà phát triển vẫn đang cân nhắc ưu và nhược điểm của các tác nhân mã hóa AI
Các công cụ này tiếp tục gặp khó khăn vì chúng cần phải giải quyết một lượng lớn bối cảnh trong các dự án phức tạp. Đọc thêm →
Chuyên gia AI dự đoán AI sẽ hủy diệt loài người vào năm 2027 – giờ ông đang thay đổi dòng thời gian của mình
Cựu nhân viên OpenAI đã dời lại ngày tận thế. Đọc thêm →
Discord đang yêu cầu ID của bạn. Phản ứng dữ dội không chỉ là về quyền riêng tư
Các nhà phê bình cho rằng việc xác minh độ tuổi bắt buộc phản ánh sự thay đổi sâu sắc hơn đối với việc kiểm tra danh tính định kỳ và giám sát kỹ thuật số. Đọc thêm →
Người đồng sáng lập Palantir đang ủng hộ một nhóm tấn công Alex Bores về công việc của anh ta với . . . Palantir
Các nhân viên hiện tại và trước đây nói với Fast Company rằng chiến dịch quảng cáo được thúc đẩy bởi sự phản đối sự ủng hộ của đảng Dân chủ đối với quy định về AI. Đọc thêm →
Tính năng ảnh động profile mới của Facebook là Boomerang cho thời đại AI
Tính năng này là một phần trong nỗ lực hướng tới nội dung AI trong ứng dụng Meta. Đọc thêm →
Đế chế kinh doanh của MrBeast vượt xa các video lan truyền trên YouTube
Các ứng dụng ngân hàng, đồ ăn nhẹ, lượt phát trực tuyến và công cụ dữ liệu đều là một phần trong danh mục đầu tư trị giá 5 tỷ USD ngày càng tăng của Jimmy Donaldson dưới sự quản lý của Beast Industries. Đọc thêm →