[Thread] 米国の論文では、最高のフロンティアLLMモデルが、専門家の人間がまだ優れているコードフォース、ICPC、およびIOIからハードコーディングの問題の0%を解くことを示しています(Rohan Paul/@rohanpaul_ai)

Date:

Share post:

ロハン・ポール / @rohanpaul_ai

[Thread] 米国の論文では、最高のフロンティアLLMモデルが、コードフォース、ICPC、およびIOIのハードコーディング問題の0%を解決していることを示しています。– これは、LLMのコーディングスキルの本当に悪いニュースです。 ☹️最高のフロンティアLLMモデルは、専門家の人間がまだ優れているドメインであるハードリアルライフプログラミングコンテストの問題で0%を達成しています。 LiveCodeBench Pro、CodeForces、ICPC、およびIOI( “Internationalからの問題で構成されるベンチマーク [image]