Daftar beritaPengenalan Mendalam Claude Opus 4.7》Peningkatan Kemampuan Coding, 1M Tanpa Kenaikan Harga, Di Mana Kekurangannya Setelah Diuji?
動區 BlockTempo2026-04-18 06:04:04

Pengenalan Mendalam Claude Opus 4.7》Peningkatan Kemampuan Coding, 1M Tanpa Kenaikan Harga, Di Mana Kekurangannya Setelah Diuji?

ORIGINALClaude Opus 4.7 深度介紹》coding 能力升級、1M 不加價,實測缺點在哪?
Analisis Dampak AIGrok sedang menganalisis...
📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯4825 kata
Anthropic merilis Claude Opus 4.7 pada 16 April, dengan fokus utama pada peningkatan coding yang signifikan (SWE-bench Pro mencapai 64,3%, naik 10,9 poin dari 53,4% pada generasi sebelumnya 4.6), resolusi visual yang ditingkatkan tiga kali lipat, dan 1M context yang tetap menggunakan harga standar tanpa long-context premium. Namun, beberapa pengguna masih melaporkan sejumlah kendala. (Konteks sebelumnya: Claude Code jadi makin bodoh? Direktur AI AMD melontarkan kritik: kedalaman berpikir anjlok 67%, biaya bulanan API melonjak 144 kali lipat) (Latar belakang tambahan: Penjual short Michael Burry menyatakan: Anthropic sedang memakan Palantir) Anthropic secara resmi meluncurkan Claude Opus 4.7 ke empat platform cloud utama pada 16 April, yaitu API, Amazon Bedrock, Google Cloud Vertex AI, dan Microsoft Foundry; pengguna GitHub Copilot Pro+, Business, dan Enterprise juga menerimanya secara bersamaan. Dibandingkan dengan versi 4.6, arah peningkatan kali ini sangat jelas, termasuk penguatan kemampuan coding sebagai jalur utama, visual sebagai prioritas kedua, sementara perubahan API adalah bagian yang paling dirasakan dan paling kontroversial bagi pengguna lama. Dalam artikel ini, saya merangkum fitur-fitur baru, kesan saya setelah mengujinya, serta kekurangan yang memicu reaksi terbelah di komunitas. Untuk memahami Opus 4.7, kita harus memahami posisinya dalam tangga model Anthropic. Di internal Anthropic masih ada Mythos (神話) yang memiliki batas kemampuan lebih tinggi, namun karena kemampuan penemuan zero-day vulnerability skala besar dianggap sebagai risiko keamanan nasional, model ini saat ini tidak dirilis ke publik dan hanya digunakan oleh lembaga federal serta vendor infrastruktur kritis yang masuk dalam daftar kerja sama Project Glasswing. Opus 4.7 adalah versi sipil "terkuat yang bisa dijual secara publik" saat ini. Ini adalah strategi dasar Anthropic. CEO Dario Amodei dalam wawancara dengan Financial Times memperkirakan bahwa model open source China akan mengejar kemampuan Mythos paling cepat dalam 6 bulan dan paling lambat 12 bulan. Sebelum itu, Opus 4.7 adalah model komersial terkuat yang bisa diberikan Anthropic kepada pasar. Dalam daftar fitur baru, tiga poin peningkatan ini adalah yang paling menonjol: Kemampuan coding meningkat pesat. SWE-bench Pro (benchmark yang mengevaluasi AI dalam menyelesaikan issue GitHub nyata) melonjak dari 53,4% pada 4.6 menjadi 64,3%, naik 10,9 poin. Skor ini menempati peringkat pertama di antara model publik, melampaui 57,7% milik GPT-5.4 dan 54,2% milik Gemini 3.1 Pro. SWE-bench Verified juga naik dari 80,8% menjadi 87,6%. CursorBench, yang secara khusus mengukur performa coding otonom Cursor IDE, melonjak dari 58% menjadi 70%. Pernyataan Anthropic sendiri adalah "tugas coding yang sebelumnya perlu pengawasan ketat sebelum diserahkan, sekarang bisa lebih tenang diserahkan ke 4.7". Workflow multi-step agentic (multi-step agentic workflow, memungkinkan Claude menyelesaikan tugas yang mencakup beberapa pemanggilan alat sekaligus) juga terasa sangat baik. Pihak resmi mengklaim ada peningkatan 14% dibandingkan 4.6, menggunakan lebih sedikit tokens, dan kesalahan penggunaan tool turun menjadi sekitar 1/3. Angka ini cukup sesuai dengan pengalaman saya saat mengujinya, yang akan saya bahas di bagian berikutnya. Kemampuan visual meningkat tiga kali lipat Opus 4.7 adalah model Claude pertama yang mendukung gambar beresolusi tinggi, maksimal hingga 2576px / 3.75MP, setara dengan tiga kali lipat dari 4.6. Saat digunakan, tangkapan layar bisa langsung dikirim tanpa perlu resize terlebih dahulu. Untuk grafik PDF, tangkapan layar IDE, draf desain, dll., model ini bisa mengingat lebih banyak detail. Jika dilihat dari skor, benchmark terkait visual mengalami peningkatan 13%. 1M token context tidak naik harga Fakta bahwa context window diperluas dari 200K ke 1M tanpa kenaikan harga adalah poin yang sangat diperhatikan semua orang. Sebelumnya pengguna sangat khawatir akan kenaikan harga atau jendela konteks yang dikurangi kembali ke 200k. Yang lebih krusial adalah Anthropic tidak mengenakan long-context premium (premi konteks panjang). Dulu, permintaan Claude yang melebihi 200K tokens akan dikenakan biaya tambahan, namun 4.7 langsung mengikuti harga standar $5 / $2
Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)
🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita
💡 Saat ini menggunakan pencocokan kata kunci + aset (MVP) · Akan ditingkatkan ke pencarian semantik embedding di masa mendatang
Informasi mentah
ID:31d7924b05
Sumber:動區 BlockTempo
Diterbitkan:2026-04-18 06:04:04
Kategori:zh_news · Kategori ekspor zh
Aset:Tidak ditentukan
Voting komunitas:+0 /0 · ⭐ 0 Penting · 💬 0 Komentar
Pengenalan Mendalam Claude Opus 4.7》Peningkatan Kemampuan Coding, 1M Tanpa Kenaikan Harga, Di Mana Kekurangannya Setelah Diuji? | Feel.Trading