| |||||
344×167![]() 1753166491.jpg/24KB | |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
2949×1877 => 400×254![]() Book1-2.jpg/832KB | |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
1119×1051 => 400×375![]() 1754804641.jpg/203KB | |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
415×227 => 400×218![]() gpt5.0.png/10KB | |||||
| |||||
| |||||
991×227 => 400×91![]() 1757638352.png/18KB | |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
再現論文が出来ましたら、しばらくはゆっくりお休みください。
さて、再現論文についてですが、
昨年のトピに、生成AIでの評価が挙げられていますが、生成AIの精度は各段に向上しています。
また現在では、昨年には無かった「grok」もあり、これの解析能力も非常に高いと考えます。
私は、再現論文を、6つの生成AIで評価してみました。
grok、O3、Claude、GPT4.1、O4、gemini2.5の6つです。
評価結果は、表のとおりです。
これをみると
「O3」と「grok」の評価が厳しめですので、評価するならば、この2つがおすすめです。
ちなみに昨年時点のGPT4や、O1で行うともっと評価が高くなってしまいますので
評価精度は圧倒的に、現在の各種バージョンのほうが厳格だと思います。
評価時は、以下を採点基準にしました。
@当該試験枠に求められるコンピテンシー
A題意
B問題文の要求事項
・必須と選択V:
技術課題を3つ以上、観点を明記、最重要課題、複数の解決策、
専門技術用語を、懸念事項、それへの対策
・選択U-2:
調査事項、検討事項、手順、留意点、工夫点、関係者列記、調整事項