DeepSeek V4 ra mắt, khả năng lập trình có thể đánh bại GPT và Claude không? Chi phí lại một lần nữa đứng đầu bảng xếp hạng

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1167 từ

DeepSeek V4 Preview đã chính thức ra mắt vào ngày 24 và được mở mã nguồn, giới thiệu hai mô hình là V4-Pro (1,6 nghìn tỷ tham số, kiến trúc MoE) và V4-Flash (284 tỷ tham số), hỗ trợ ngữ cảnh lên đến 1 triệu token. (Tóm tắt trước: DeepSeek V4 từ chối NVIDIA để tìm đến Huawei! Alibaba, ByteDance, Tencent tranh nhau mua chip Ascend 950 PR) (Bổ sung bối cảnh: DeepSeek V4 ra mắt vào cuối tháng 4, Liang Wenfeng xác nhận nội bộ: cửa sổ 1 triệu token, chạy hoàn toàn trên chip Ascend 950 PR của Huawei) Sau bao mong đợi từ cộng đồng, DeepSeek hôm nay (24) đã chính thức ra mắt mô hình ngôn ngữ lớn mã nguồn mở mới nhất DeepSeek V4 Preview, đồng thời đưa ngữ cảnh 1 triệu token trở thành tiêu chuẩn cho toàn bộ dòng sản phẩm. Liệu nó có đủ sức cạnh tranh với các mô hình đóng hiện nay tại Thung lũng Silicon? Trong bài kiểm tra mã nguồn SWE-bench, DeepSeek V4 Preview đạt 83,7%, vượt qua Claude Opus 4.6 (80,9%) và GPT-5.2 (80%). Mặc dù chưa bắt kịp các mô hình flagship mới nhất, nhưng kết quả này đã đủ gây kinh ngạc. Dòng V4 ra mắt hai mô hình: V4-Pro (1,6 nghìn tỷ tham số, kích hoạt 49 tỷ mỗi lần suy luận) và V4-Flash (284 tỷ tham số, kích hoạt 13 tỷ). Kiến trúc là Mixture-of-Experts (MoE), nói một cách đơn giản là mô hình này không huy động toàn bộ nơ-ron mỗi lần hoạt động, mà gọi một phần nhỏ các "chuyên gia" theo nhu cầu, giúp giảm đáng kể mức tiêu thụ điện toán mà không làm giảm chất lượng câu trả lời. Cửa sổ ngữ cảnh đạt 1 triệu token. Một lần có thể đọc trọn bộ 7 tập "Harry Potter" cộng với một lượng lớn kho mã nguồn. DeepSeek-V4-Pro Max không "thống trị mọi bảng xếp hạng", nhưng định vị của nó rất rõ ràng: cực kỳ mạnh mẽ trong các tác vụ suy luận, lập trình và Agentic. - Về suy luận kiến thức, nó tiệm cận GPT-5.4 / Gemini-3.1-Pro / Opus-4.6 - Khả năng lập trình và Agentic đặc biệt nổi bật - Tuy nhiên, ở một số bảng xếp hạng suy luận độ khó cao, nó vẫn bị GPT-5.4, Gemini-3.1-Pro hoặc Opus-4.6 vượt mặt. Hiệu suất Agentic của DeepSeek-V4-Pro Max có thể nói là ổn định và mạnh mẽ: - Đạt 80,6 trên SWE Verified, gần như ngang bằng Gemini-3.1-Pro, thấp hơn một chút so với Opus-4.6 - Đạt 83,4 trên BrowseComp, cũng gần với 83,7 của Opus-4.6, chỉ thua 85,9 của Gemini - Đạt 73,6 trên MCPAtlas Public, gần như đuổi kịp 73,8 của Opus-4.6, dẫn trước GPT-5.4 và Gemini Giá định mức của DeepSeek V4 là khoảng 0,3 USD cho mỗi triệu token đầu vào, rẻ hơn 27 lần so với các mô hình đóng tương đương. Đồng thời, V4 chạy hoàn toàn trên chip Ascend 950 PR của Huawei, không sử dụng CUDA của NVIDIA. Trong bối cảnh các biện pháp kiểm soát xuất khẩu của Mỹ ngày càng thắt chặt, đây không chỉ là một lựa chọn kỹ thuật mà còn là chiến lược sinh tồn dài hạn, và DeepSeek đã đưa ra phiên bản khả dụng quy mô lớn đầu tiên với V4.

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-03

Kiểm tra bảo mật của GPT-5.5 đạt điểm gần như tương đương với Claude Mythos, đánh giá mới nhất đã bác bỏ lý do của Anthropic cho rằng nó quá nguy hiểm để công khai.

Độ tương đồng 140%關鍵字 gpt/claude同分類 zh

2026-05-03

Kết quả kiểm tra an ninh của GPT-5.5 đạt điểm gần như tương đương với Claude Mythos, bác bỏ lý do của Anthropic rằng nó quá nguy hiểm để công khai.

Độ tương đồng 140%關鍵字 gpt/claude同分類 zh

2026-04-24

DeepSeek V4 đã ra mắt—Phiên bản Pro của nó có chi phí thấp hơn 98% so với GPT 5.5 Pro

Độ tương đồng 130%關鍵字 gpt/deepseek

2026-04-23