Danh sách tinGoogle ra mắt TPU thế hệ thứ 8: Hai dòng chip AI chuyên biệt cho huấn luyện và suy luận, thách thức điểm yếu của Nvidia
動區 BlockTempo2026-04-23 01:16:08

Google ra mắt TPU thế hệ thứ 8: Hai dòng chip AI chuyên biệt cho huấn luyện và suy luận, thách thức điểm yếu của Nvidia

ORIGINALGoogle 推第八代 TPU:兩款 AI 晶片分攻訓練與推論,挑戰 Nvidia 痛點
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1896 từ
Google đã công bố thế hệ TPU thứ tám tại Cloud Next 2026, lần đầu tiên tách biệt các tác vụ huấn luyện và suy luận thành hai loại chip chuyên dụng: TPU 8t và TPU 8i, với tuyên bố hiệu suất trên mỗi đô la tăng tới 80%. (Thông tin thêm: Anthropic công bố hợp tác với Broadcom, Google mở rộng việc áp dụng chip TPU, doanh thu hàng năm tăng lên 30 tỷ USD) (Thông tin nền: Ngay cả "con cưng" của Nvidia cũng không ổn! Cổ đông lớn nhất của Core Scientific từ chối thương vụ mua lại của CoreWeave: Định giá 9 tỷ USD là quá thấp) Khi thế hệ TPU đầu tiên của Google (Tensor Processing Unit, một loại chip tự phát triển được thiết kế cho tính toán AI) ra mắt vào năm 2016, thị trường dự đoán nó sẽ trở thành kẻ kết liễu Nvidia. Kết quả là: Trong thập kỷ qua, giá trị thị trường của Nvidia đã tăng gấp hàng chục lần từ hàng trăm tỷ USD, và hầu hết những dự đoán đó đã không thành hiện thực. Lần này, tại hội nghị Cloud Next 2026, Google đã ra mắt thế hệ TPU thứ tám và đưa ra một quyết định chưa từng có trước đây: tách biệt huấn luyện và suy luận, mỗi loại sử dụng một con chip riêng để xử lý. Cái gọi là "huấn luyện" và "suy luận" là hai giai đoạn hoàn toàn khác nhau trong tính toán AI. - Huấn luyện là quá trình để mô hình học hỏi từ lượng dữ liệu khổng lồ, đòi hỏi mật độ tính toán cực cao. - Suy luận là quá trình mô hình phản hồi mỗi truy vấn của người dùng sau khi đã học xong, đòi hỏi độ trễ thấp và chi phí thấp. Trước đây, Google sử dụng cùng một loại TPU để đáp ứng cả hai nhu cầu này, nhưng bắt đầu từ thế hệ thứ tám, cả hai chính thức tách biệt. TPU 8t là chip chuyên dụng cho huấn luyện: sở hữu khả năng tính toán dấu phẩy động 4-bit 12,6 petaFLOPS (petaFLOPS, tức là một triệu tỷ phép tính dấu phẩy động mỗi giây, con số càng lớn tính toán càng nhanh), bộ nhớ băng thông cao 216 GB và băng thông bộ nhớ 6,5 TB/s. Google tuyên bố con chip này có tốc độ huấn luyện nhanh gấp 3 lần thế hệ trước và có thể cho phép hơn 1 triệu TPU cùng phối hợp trong một cụm duy nhất. TPU 8i là chip chuyên dụng cho suy luận: sở hữu khả năng tính toán FP4 10,1 petaFLOPS, bộ nhớ băng thông cao 288 GB và bộ nhớ trên chip lớn hơn 384 MB (được sử dụng để giảm độ trễ di chuyển dữ liệu). Google cho biết hiệu suất suy luận trên mỗi đô la của nó tăng 80% so với thế hệ Ironwood TPU trước đó, đặc biệt nổi bật trong mục tiêu độ trễ thấp. Hai loại chip này dự kiến sẽ chính thức mở cửa cho bên ngoài vào năm 2026. Hướng đi tách biệt chip lần này của Google nhắm thẳng vào một trong những điểm yếu của Nvidia: tính phổ quát. GPU của Nvidia là một dòng sản phẩm duy nhất phục vụ cả huấn luyện và suy luận. Chip Vera Rubin sắp ra mắt của Nvidia có thông số kỹ thuật là 35 petaFLOPS tính toán FP4, bộ nhớ HBM4 288 GB, băng thông bộ nhớ 22 TB/s — con số sức mạnh tính toán thô vẫn dẫn trước 12,6 petaFLOPS của Google TPU 8t. Nhưng việc so sánh thuần túy petaFLOPS sẽ che khuất một khía cạnh khác: cấu trúc chi phí. Sự cạnh tranh trên thị trường suy luận về bản chất là "chi phí cho mỗi lần mô hình trả lời". Google đặt mục tiêu thiết kế của TPU 8i là giảm chi phí đơn vị suy luận, và đây chính là con số mà các nhà sản xuất mô hình lớn như Anthropic, OpenAI quan tâm nhất. Đáng chú ý là Anthropic đã thông báo sẽ mở rộng việc huấn luyện và dịch vụ của Claude lên dung lượng TPU "cấp độ nhiều gigawatt", trở thành khách hàng TPU lớn nhất được công khai cho đến nay; OpenAI cũng đã bắt đầu sử dụng dung lượng TPU của Google. Tuy nhiên, bản thân Google cũng không phủ nhận Nvidia. Họ đồng thời thông báo rằng đám mây của mình sẽ cung cấp chip Nvidia Vera Rubin vào cuối năm 2026. Hơn nữa, hai công ty đang hợp tác để tăng cường giao thức mạng "Falcon",
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:f956b2da18
Nguồn:動區 BlockTempo
Đăng:2026-04-23 01:16:08
Danh mục:zh_news · Danh mục xuất zh
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận
Google ra mắt TPU thế hệ thứ 8: Hai dòng chip AI chuyên biệt cho huấn luyện và suy luận, thách thức điểm yếu của Nvidia | Feel.Trading