#124: GAIA: a benchmark for General AI Assistants Misreading Chat - En podcast av Hajime Morrita, Jun Mukai Spela upp Kategorier: Teknik LLM に解かせる難問集と採点結果を向井が睨みました。