Danh sách tinAnthropic thừa nhận Claude "thực sự trở nên ngốc hơn": Ba lỗi cấu hình kỹ thuật, đã đặt lại tất cả hạn mức đăng ký để bồi thường
動區 BlockTempo2026-04-24 01:41:06

Anthropic thừa nhận Claude "thực sự trở nên ngốc hơn": Ba lỗi cấu hình kỹ thuật, đã đặt lại tất cả hạn mức đăng ký để bồi thường

ORIGINALAnthropic 承認 Claude「真的變笨」:三個工程配置失誤,已重置所有訂閱額度當補償
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1702 từ
Gần đây cộng đồng liên tục phản ánh Claude có dấu hiệu sa sút, Anthropic vào ngày 23 đã công bố báo cáo hậu kiểm, cho biết nguyên nhân gốc rễ không nằm ở bản thân mô hình mà là do sai sót kỹ thuật ở ba tầng sản phẩm, sự chồng chéo của cả ba đã khiến người dùng toàn cầu cảm nhận rõ rệt sự sụt giảm về chất lượng. (Tóm tắt trước đó: Định giá mới nhất của Anthropic vọt lên "800 tỷ USD" gấp đôi trong hai tháng, IPO sớm nhất vào tháng 10) (Bổ sung bối cảnh: Dự án mã nguồn mở badclaude giúp tăng tốc Claude code đã bị Anthropic gửi thư thông báo vi phạm bản quyền) Bạn có cảm thấy gần đây Claude thực sự "trở nên ngốc hơn" không? Có người nói khả năng suy luận của nó trở nên nông hơn, có người nói nó bắt đầu xuất hiện ảo giác, có người nói tốc độ tiêu thụ token của nó nhanh hơn nhưng chất lượng lại giảm sút, thậm chí còn xuất hiện một thuật ngữ mới là AI shrinkflation (lạm phát thu hẹp AI). Mượn khái niệm "khối lượng ít đi nhưng giá không đổi" của hàng tiêu dùng để mô tả hiện tượng chất lượng đầu ra của mô hình âm thầm giảm sút trong cùng một chi phí. Số liệu kiểm tra của BridgeMind còn thẳng thắn hơn: Độ chính xác của Claude Opus 4.6 giảm từ 83,3% xuống 68,3%, thứ hạng tụt từ vị trí thứ 2 xuống thứ 10. Stella Laurenzo, Giám đốc cấp cao bộ phận AI của AMD, đã phân tích 6.852 bản ghi phiên làm việc của Claude Code và hơn 230.000 lần gọi công cụ trên GitHub, cũng phát hiện độ sâu suy luận của mô hình giảm rõ rệt, có xu hướng chọn "cách sửa đơn giản nhất" thay vì "giải pháp đúng đắn". Về vấn đề này, Anthropic đã chính thức công bố báo cáo hậu kiểm vào ngày 23 tháng 4, thừa nhận vấn đề thực sự tồn tại, nhưng cho biết nguyên nhân gốc rễ không nằm ở việc huấn luyện mô hình mà nằm ở cấu hình kỹ thuật của ba tầng sản phẩm. Anthropic xác nhận ba thay đổi độc lập ở tầng sản phẩm đã chồng chéo gây ra đợt suy giảm chất lượng này: Thứ nhất, hạ cấp reasoning effort (3 tháng 4). Anthropic đã điều chỉnh reasoning effort mặc định của Claude Code từ "cao" xuống "trung bình". Cái gọi là reasoning effort là cấu hình "suy nghĩ sâu bao nhiêu" trước mỗi câu trả lời của mô hình, thiết lập càng cao thì thời gian mô hình dành cho suy luận nội bộ càng dài, nhưng giao diện trông cũng giống như bị "đơ" hơn. Để giải quyết vấn đề cảm quan về độ trễ UI, Anthropic đã chọn giảm giá trị mặc định mà không đánh giá đầy đủ tác động đối với các tác vụ phức tạp. Thứ hai, lỗi caching bug (26 tháng 3). Các kỹ sư đã thiết kế một logic tối ưu hóa để mô hình xóa lịch sử suy nghĩ cũ sau khi nhàn rỗi hơn một giờ nhằm tiết kiệm không gian bộ nhớ đệm. Nhưng trong quá trình thực hiện có một sai lầm then chốt: hành động xóa không được thực hiện một lần sau khi nhàn rỗi, mà liên tục được kích hoạt trong mỗi vòng đối thoại tiếp theo. Kết quả là mô hình liên tục mất đi "trí nhớ ngắn hạn", dẫn đến tình trạng quên và lặp lại liên tục trong các cuộc đối thoại dài. Thứ ba, hạn chế dư thừa trong system prompt (16 tháng 3). Anthropic đã thêm chỉ thị vào system prompt ở hậu trường, yêu cầu mô hình nén văn bản giữa các lần gọi công cụ trong vòng 25 từ và nén phản hồi cuối cùng trong vòng 100 từ. Biện pháp vốn dùng để giảm đầu ra dư thừa của Opus 4.7 này lại vô tình ảnh hưởng đến Opus 4.6, dẫn đến chất lượng mã nguồn giảm 3%. Điểm chung của ba thay đổi này là: chúng đều xảy ra ở tầng Harness (môi trường thực thi mô hình, một lớp vỏ kỹ thuật bao bọc mô hình, quyết định system prompt, logic bộ nhớ đệm, v.v.), chứ không phải bản thân việc huấn luyện mô hình, nhưng lại đủ để người dùng toàn cầu cảm nhận được sự chênh lệch rõ rệt. Anthropic đã sửa lỗi bộ nhớ đệm trong phiên bản v2.1.116 và khôi phục các thiết lập về reasoning effort và hạn chế
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:221c38dd8d
Nguồn:動區 BlockTempo
Đăng:2026-04-24 01:41:06
Danh mục:zh_news · Danh mục xuất zh
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận
Anthropic thừa nhận Claude "thực sự trở nên ngốc hơn": Ba lỗi cấu hình kỹ thuật, đã đặt lại tất cả hạn mức đăng ký để bồi thường | Feel.Trading