掲示板for技術士受験応援ページ

[ HOME｜掲示板TOP｜ツリー表示｜一覧表示｜トピック表示｜新規投稿｜記事検索｜過去ログ｜携帯用URL ]

[8402]

★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：たこやき 2025/07/22(火) 15:41:31

技術士第二次試験を受験された皆様、大変お疲れ様でした。
再現論文が出来ましたら、しばらくはゆっくりお休みください。

さて、再現論文についてですが、
昨年のトピに、生成AIでの評価が挙げられていますが、生成AIの精度は各段に向上しています。
また現在では、昨年には無かった「grok」もあり、これの解析能力も非常に高いと考えます。

私は、再現論文を、６つの生成AIで評価してみました。
grok、O3、Claude、GPT4.1、O4、gemini2.5の６つです。
評価結果は、表のとおりです。
これをみると
「O3」と「grok」の評価が厳しめですので、評価するならば、この２つがおすすめです。
ちなみに昨年時点のGPT４や、O1で行うともっと評価が高くなってしまいますので
評価精度は圧倒的に、現在の各種バージョンのほうが厳格だと思います。

評価時は、以下を採点基準にしました。
①当該試験枠に求められるコンピテンシー
②題意
③問題文の要求事項
　・必須と選択Ⅲ：
　技術課題を３つ以上、観点を明記、最重要課題、複数の解決策、
　専門技術用語を、懸念事項、それへの対策
　・選択Ⅱ-2：
　　　調査事項、検討事項、手順、留意点、工夫点、関係者列記、調整事項

344×167

1753166491.jpg/24KB

引用返信/返信削除キー

[8437]

★★★再現論文をAI評価する場合のプロンプト例

Name：たこやき 2025/07/23(水) 10:10:56

生成AIを活用して再現論文を評価する場合の
プロンプト例を掲載しておきますね。「必須」の場合の例となります。
↓↓↓↓↓↓↓

以下の「日本技術士会の問題文」に対し、「論文」を作成しました。
「日本技術士会の問題文」の題意及び、「日本技術士会の採点基準」に基づき、「論文」を採点して下さい
この論文が「日本技術士会の問題文」の題意にあった内容かもをおしえてください
採点においては、以下のどのランクなのかを示してください
A1：100～96点以上
A2：95～90点以上
B1：89～86点以上
B2：85～80点以上
C1：79～76点以上
C2：75～70点以上
D1：69～66点以上
D2：65～60点以上
E1：59～56点以上
E2：55～50点以上
F1：49～46点以上
F2：45～40点以上
G：39点未満

また採点時は以下に気を付けてください
・「論文」は1800文字以内で作成するルールであるため、1800文字以内に収まるように論文を作成しており
　必要な全ての事項を網羅的・具体的に記述していないこと。
・「論文」では、３つの課題のうち、１つの課題に対する３つの解決策を書けばよいルールになっていること。

「日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーー

「論文」
ーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーー

「日本技術士会の採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーー
「専門的学識」
技術士が専門とする技術分野（技術部門）の業務に必要な、技術部門全般にわたる専門知識及び選択科目に関する専門知識を理解し応用すること。技術士の業務に必要な、我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用すること。

「問題解決」
業務遂行上直面する複合的な問題に対して、これらの内容を明確にし、調査し、これらの背景に潜在する問題発生要因や制約要因を抽出し分析すること。複合的な問題に関して、相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）、それらによって及ぼされる影響の重要度を考慮した上で、複数の選択肢を提起し、これらを踏まえた解決策を合理的に提案し、又は改善すること。

「評価」
業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資すること。

「技術者倫理」　
業務遂行にあたり、公衆の安全、健康及び福利を最優先に考慮した上で、社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に努め、技術士としての使命、社会的地位及び職責を自覚し、倫理的に行動すること。業務履行上、関係法令等の制度が求めている事項を遵守すること。業務履行上行う決定に際して、自らの業務及び責任の範囲を明確にし、これらの責任を負うこと。

「コミュニケーション」
業務履行上、口頭や文書等の方法を通じて、雇用者、上司や同僚、クライアントやユーザー等多様な関係者との間で、明確かつ効果的な意思疎通を行うこと。海外における業務に携わる際は、一定の語学力による業務上必要な意思疎通に加え、現地の社会的文化的多様性を理解し関係者との間で可能な限り協調すること。
ーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8443]

Re: Re: 最新の生成AIによる再現論文の評価

Name：カメラアントゴレイヌ 2025/07/23(水) 12:20:37

これは評価されるべき

引用返信/返信削除キー

[8448]

Re: 最新の生成AIによる再現論文の評価

Name：5回目 2025/07/23(水) 13:56:37

私も生成AI(chatgpt4.1とO3)で遊んでいます。
私は手元に去年のB判定論文の成績開示結果と通信講座の復元論文採点結果があるので、そのそれぞれの点数や添削結果のコメントを生成AIに読み込ませて、採点してもらっています。

AIに昨年の問題と昨年の復元論文(論文A)を提示し、この論文Aの実際の点数は〇点です(開示していない方は判定得点レンジ〇点-〇点)、通信講座での指摘内容は△で〇点でした、この点数と内容を踏まえ、論文Aと比較して今年の論文Bの評価と採点をお願いすると
ある程度適格なコメントと現実的な点数を頂ける・・・気がします

引用返信/返信削除キー

[8449]

Re: Re: 最新の生成AIによる再現論文の評価

Name：fusen 2025/07/23(水) 14:11:22

具体的な採点基準(各コンピテンシーの配点等)が示されていないのに、AIはどのように採点しているのですか？

引用返信/返信削除キー

[8450]

Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：5回目 2025/07/23(水) 14:25:48

ぶっちゃけた話、気休めとエンタメなので細かいことは気にしていません(笑)
自分は各設問ごと、または各コンピテンシーごとに採点しているものとし、２つの採点結果を基に、AIの気分で配点を決めてもらい、採点してもらっています。
また、昨年の論文と比較し、どこに加点要素があってどこに減点要素があるのかを聞くようにしています。
とりあえず、B判定の論文と問題文を放り込んでも70点80点みたいな非現実的な点数は出なく無くなりました。

引用返信/返信削除キー

[8453]

Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/23(水) 16:45:33

生成AIは、各コンピテンシーの要求事項に基づき、論文内容に関する
題意への適合性（理解）、論理構成、技術的妥当性、具体性・実現可能性、倫理・社会的配慮を精緻にチェックしてくれます。
具体的な採点基準(各コンピテンシーの配点等)は、不明ですが、出来具合は点数化できますよね。
過去のAIによる評定と、実際の結果は近似しています
あとは、再現論文の質と、プロンプト次第です。

するもしないも自由です。

引用返信/返信削除キー

[8456]

Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：ジョニーサンダース 2025/07/23(水) 17:27:36

そうですよね。
過去の自分の論文(技術士本試験での評価)やネットで公開しているＡ・Ｂ・Ｃ評価の論文などを生成ＡＩに読み込ませ、プロンプトの内容を吟味すれば、多少は点数が高くなる評価が多かったが、相関関係はあったよ。

どう向き合うかで変わると思うよ。
確かに生成ＡＩは嘘をつくけど、その嘘を見抜けるようになればレベルが上がっていると考えるべきだと思う。

また、生成ＡＩでは定量評価を求めてるので、ある程度数字の根拠を確認することも必要である。

引用返信/返信削除キー

[8458]

Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/23(水) 18:15:17

生成ＡＩの評定に関し、
論述内容と、自身の習熟度に関する妥当性を検証する姿勢も
また大事だと思います。

引用返信/返信削除キー

[8464]

Re: Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：鋼コン 2025/07/23(水) 21:53:13

たこやきさんのプロンプトだと大体、本試験の何点がAIの80点くらいになるんでしょうか？

引用返信/返信削除キー

[8466]

Re: Re: Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：GN 2025/07/23(水) 22:55:49

私の場合、ChatGPT、Grok、Genimiで採点比較してみましたところ、Genimiが一番厳しい評価で、ChatGPT、Grokは甘めの評価がでました。部門によってAIも得意不得意あるんでしょうかね？

引用返信/返信削除キー

[8473]

Re: Re: Re: Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/24(木) 10:06:24

可能性はあります。
AIは、データドリフトやバイアスによる特徴量の偏りは当然にありますので。

引用返信/返信削除キー

[8474]

Re: Re: Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/24(木) 10:14:16

昨年、O1で再現論文を評価させたときに、
必須と選択Ⅲは、O1で80点前後で、本試験ではいずれともA判定でした。
選択Ⅱは、O1で50～60点であり、それらは本試験でBでしたね。

注意点として、GPTはどのバージョンも論評が甘いです。なので
本試験評定との乖離は否めません。

なので、OpenAIあるいはgrokを逍遥いたします。
GPTと違い、OpenAIのO3やO4、grokは各段に高精度で評価が厳格だと思います。
本試験の評定に近似すると思います。

引用返信/返信削除キー

[8475]

Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/24(木) 10:22:46

確かにそうですね。
生成AIには、バイアス、データドリフト、ハルシネーションがある。
言うなれば、ただそれだけのことです。
技術士の試験勉強をしてきたならば、みなさん、論理性や専門性などの習熟度が高くなっているでしょうし
多面的に様々な観点から勉強されているでしょうから、
生成AIの出力内容における専門的な内容について、誤情報が含まれる場合に、その判断は十分に可能だと思います。
振り回されることはまず無いでしょう。

仮に生成AIの出力内容に誤情報があった場合に、これに盲従的になるようであれば
それは合格水準にないことを意味すると考えます。

引用返信/返信削除キー

[8476]

Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/24(木) 13:21:41

試験終了後にAIで論文を評価する行為は、
合否に直接影響しないとしても、「自己研鑽」「口頭試験対策」「次回への備え」「技術者としての文章力向上」など
あるいは、技術士に求められるコンピテンシを、AIという第三者の視点で振り返る手段として極めて有効だと考えます。
上記より、再現論文を作成した上で、生成AIで評価することについて
以下①②③④の意義があると考えます。

① 自己能力の棚卸しと課題の可視化
自己評価だけでは見落としがちな、実は評価につながる記述があったり、その逆、あるいは、専門用語の不適切さ、題意からの逸脱などを、AIが構造的・論理的に指摘してくれます。これは、「自分の弱点の把握」につながり、今後の技術文書作成や口頭試験、業務における報告書作成にも活かされます

② 口頭試験への有効な準備
筆記試験を通過すると、次は口頭試験が待っています。口頭試験では、自ら書いた論文の内容に基づいて問われるため、後日AIで再評価し、内容の一貫性や論理の甘さを把握しておくことは、説得力のある応答の準備に極めて有効です

③ 論理的思考力と技術表現力の研鑽
配点が明示されていないとしても、AIは技術会が示すコンピテンシに示される採点基準に基づき忠実に分析できます。これは、口頭試験時はもとより、次の受験や、業務報告・学会発表等の技術文書作成力の向上に直結します。

④ 学習としての論文評価の蓄積
生成AIを用いて複数の論文を評価していくことで、自分の答案だけでなく、他人の答案との比較も可能になり、「高評価されやすい構成や表現のパターン」が見えてきます。

引用返信/返信削除キー

[8484]

★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Name：たこやき 2025/07/24(木) 19:36:31

私は、昨年、選択ⅡのみがBだったので不合格でした。
そのため今年は選択Bをかなり強化して挑みました。
昨年2024版と今年2025年版の論文の出来を比較しようと考え、
grokを活用して以下のプロンプトを作成し、比較させたところ、
今年2025年版のほうが15点ほど高い評価結果となりました。
昨年よりも今年の論文の出来(質)がよいこと客観的に確認できました。

参考までに昨年と今年の論文を比較するプロンプトを掲載しておきます。

↓↓↓↓↓↓

以下に、２つの情報を用意しました。
A：「2024年度日本技術士会の問題文」に対する「2024年の論文」
B：「2025年度日本技術士会の問題文」に対する「2025年の論文」

「日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき、「2024年の論文」と「2025年の論文」とではどちらが優れていますか？
尚、「論文」は1200文字以内で作成するルールであるため、1200文字以内に収まるように論文を作成することを優先し、必要な全ての事項を網羅的・具体的に記述していないことに注意してください。
採点においては、以下のどのランクなのかを示してください
A1：100～96点以上
A2：95～90点以上
B1：89～86点以上
B2：85～80点以上
C1：79～76点以上
C2：75～70点以上
D1：69～66点以上
D2：65～60点以上
E1：59～56点以上
E2：55～50点以上
F1：49～46点以上
F2：45～40点以上
G：39点未満

「2024年の日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーー

「2025年の日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーー

「2025年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーー

「採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
「専門的学識」
技術士が専門とする技術分野（技術部門）の業務に必要な、技術部門全般にわたる専門知識及び選択科目に関する専門知識を理解し応用すること。
技術士の業務に必要な、我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用すること。
「マネジメント」
業務の計画・実行・検証・是正（変更）等の過程において、品質、コスト、納期及び生産性とリスク対応に関する要求事項、又は　成果物（製品、システム、施設、プロジェクト、サービス等）に係る要求事項の特性（必要性、機能性、技術的実現性、安全性、経済性等）を満たすことを目的として、人員・設備・金銭・情報等の資源を配分すること。
「コミュニケーション」
業務履行上、口頭や文書等の方法を通じて、雇用者、上司や同僚、クライアントやユーザー等多様な関係者との間で、明確かつ効果的な意思疎通を行うこと。
「リーダーシップ」
業務遂行にあたり、明確なデザインと現場感覚を持ち、多様な関係者の利害等を調整し取りまとめることに努めること。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8501]

Re: Re: 最新の生成AIによる再現論文の評価

Name：みるふわわ求愛希望 2025/07/25(金) 02:00:27

これは評価されるべき

引用返信/返信削除キー

[8518]

Re: Re: 最新の生成AIによる再現論文の評価

Name：伏龍 2025/07/25(金) 12:33:02

試験時にキーボード入力にしてくれると，大変，ありがたいと思う受験生は多いことでしょう．
書いて・消して・・・の繰り返しはなかなかの苦労ですから．

それで，仮にもし，キーボード入力可能な試験になった場合，
AI判定で，合否発表も短縮できるかもしれませんよね．

自己評価にAI評価をミックスして，
自分のアウトプットの質を高めることにも役立つでしょうし．
この類のAI活用は，今後も進んで，より一層，AIも育っていくのかもしれません．

1つ気になるのは・・・
人の目で読んで評価する際，
字の読みやすさや，ページレイアウトの妙や，文字誇張の影響は，
多少なりとも，あるかと思っています．
後進育成で，査読する際，そう感じてしまう時もあるので．
そうすると，紙面としての印象は，AI判定の対象外になっていると思います．
分かりやすいプレゼン資料．という観点では，
現時点，AI評価に組み込みにくい要素なのでしょうか．．．

引用返信/返信削除キー

[8522]

Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/25(金) 12:58:49

『AI判定で，合否発表も短縮』は危険な策かと。

理由は、AIは、データドリフト、バイアス、ハルシネーション、ブラックボックスなどといった問題があるからです。AIへの過度な依存はよくありません。
要するに合否判断の責任。これの所在のが不明瞭となります。
不合格になりました。AIの判定結果です。は、倫理的・合理的ではないですよね。
技術論ゆえに、判断の主体性を放棄するわけにはいかないと思います。
昨今、AI・生成AIの普及に伴い、人間の知性を一時的なインターフェースに矮小化する傾向が助長化しているように思えますので、我々もこれに留意しAI・機械学習等の活用に留意しなければなりませんね。

また、ブラックボックスに対しては、XAIという１つの対応策がありますが、これにしても結局は、AIの出力結果に対し、人が妥当性の判断を行うという姿勢は不可欠だと私は思います。

引用返信/返信削除キー

[8556]

Re: 最新の生成AIによる再現論文の評価

Name：AI 2025/07/27(日) 12:34:32

Chatgptに採点してもらったら、必須Bでした。ショックです。
コマンドは以下のとおりです。
ーーーーーーーー
「日本技術士会が定める「専門的学識」、「問題解決」、「評価」、「技術者倫理」、「コミュニケーション」の定義の文字列」上記の「専門的学識」、「問題解決」、「評価」、「技術者倫理」、「コミュニケーション」の観点を念頭に以下の「問題文」に対し、「論文」を作成しましたので「論文」を採点してください。採点においては、A・B・Cのランク付けをしてください。 40点満点でAは24点以上、Bは16点～24点未満、Cは16点未満とします。
採点に当たり、https://www.engineer.or.jp/c_topics/010/attached/attach_10795_2.pdf
の技術士に求められる資質能力（コンピテンシー）を参考にしてください。
----------------------------
＃問題文

----------------------------------
#解答文

引用返信/返信削除キー

[8557]

Re: 最新の生成AIによる再現論文の評価

Name：AI 2025/07/27(日) 12:36:04

選択Ⅱ-1は5点でした。ショックです。
--------
「日本技術士会が定める「専門的学識」、「問題解決」、「評価」、「技術者倫理」、「コミュニケーション」の定義の文字列」上記の「専門的学識」、「問題解決」、「評価」、「技術者倫理」、「コミュニケーション」の観点を念頭に以下の「問題文」に対し、「論文」を作成しましたので「論文」を採点してください。採点においては、A・B・Cのランク付けをしてください。 10点満点でAは6点以上、Bは4点～6点未満、Cは4点未満とします。
採点に当たり、https://www.engineer.or.jp/c_topics/010/attached/attach_10795_2.pdf
の技術士に求められる資質能力（コンピテンシー）を参考にしてください。Ⅱ-1では、技術士に求められる資質能力（コンピテンシー）のうち、専門的学識、コミュニケーションの各項目が評価されます。
----------------------------
＃問題文
------------------------
#解答文

引用返信/返信削除キー

[8558]

Re: Re: 最新の生成AIによる再現論文の評価

Name：なめたけ 2025/07/27(日) 15:21:40

受験の偏差値と同じで、AIの採点は生成AIの種類やバージョンで全然異なるので試験管と同じような点数での採点なんて無理ですよ。
クオリティの明らかに違う2つの論文に対し、投稿する順番や聞き方を変えるだけで評価が180度変わりますし。
そもそも採点のベンチマークにする実際の論文開示結果が複数ないと点数なんて出しようがないですよ。

引用返信/返信削除キー

[8560]

プロンプト、使わせていただきました！

Name：さかな 2025/07/27(日) 15:37:44

たこやき様、ＡＩさま。
プロンプト例、ありがとうございます。

私の手元には、合格・不合格の両方の再現論文と、
それぞれの開示点数がありまして・・・
お二人のプロンプトを使わせていただいて
採点をさせてみたところ・・・

たこやきさんのプロンプトでは、
不合格論文が合格評価になりました。

ＡＩさんのプロンプトでは、
合格論文が不合格評価になりました。

使ったのはGEMINI2.5とGROKです。
点数は同じにはなりませんでしたが、合否評価は同じでした。

AIの採点は、見落としや思い込みのチェックにはすごく有用だと思います。
でも、採点結果は、参考程度にとどめておいた方がよいかもしれません。

それにしもて、AIのプロンプト設定は、楽しい作業ですね～。
どう調整したら狙った結果を出せるか・・・
やり始めたら、休日なんてあっという間です。。。

引用返信/返信削除キー

[8570]

Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/28(月) 10:11:44

プロンプト文がよくありませんね。
ましてや読み込ませているPDFが、「技術士第二次試験受験申込み案内」であり
ここから、「コンピテンシーを探せ」としてしまうと、AI側の解析精度は下がると思いますよ。
こんあおおざっぱなインプットでは、解析精度も下がります。

AIの使い方を誤解されている方が”非常に”多いのですが、
AIの解析精度は、プロンプト文次第です。
これは当たり前のことです。インプットと特徴の相関性のアルゴリズムですから。
よって、AIによる論文の評価を行うのであれば、
解析ポイントを明確・端的に示したプロンプトを投げる必要があります。

「AI」さんのプロンプトは、あまりに雑であり
解析時に寄与する特徴の質と量が、散漫すぎます。

引用返信/返信削除キー

[8571]

Re: プロンプト、使わせていただきました！

Name：たこやき 2025/07/28(月) 10:23:00

さかな様
ご返信ありがとうございます。
不合格論文が合格になったのとのこと。

以下、２点、提案します。

①１つめ
不合格論文をおもちなのであれば、
No.8484のプロンプトを少し改良してためしてみてはいかがでしょうか。
例えば、不合格論文を示し、かつコンピテンシーの採点基準に基づき「不合格」となった論文である旨を
付記した上で、今年の論文との比較評価をAIにさせる。

②２つめ
以下のサイトでは、市場の様々な生成AIを使用することができます。
しかも、同時実行できます。これらの複数の生成AIの評価結果から、一定の総評をするのも
悪くないと思います
https://oshiete.ai/

引用返信/返信削除キー

[8572]

Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/28(月) 10:33:16

おっしゃるとおり、AIの採点は、AIの種類やバージョンにより異なります。
AIによって、同事項で、プラス評価をするものもあれば、マイナス評価をするものもありますね。
かつ、当然ながら性能変動もします。

なので、理想的なのは、過去の不合格論文があれば、これをコンピテンシーに基づいた不合格の基準として
今年の論文の評価ができるとよいのかなと思います。

引用返信/返信削除キー

[8574]

★★★2024版／2025年版論文のAI比較を行うプロンプト例（想定配点バージョン）

Name：たこやき 2025/07/28(月) 11:12:08

AIで論文評価を行う際に、お手元に、”過去の不合格論文がある”場合は、
これにより、AIによる、コンピテンシーの採点基準に基づく合否の定性分析が可能になりますので
以下のプロンプトを活用してみてください。
プロンプトは、選択Ⅱー２の例です。
ちなみに、採点基準はそれぞれ５点配点にしています。選択Ⅱー２の例なので合計20点になる配点です。
他の必須問題や、選択Ⅱ-1や選択Ⅲはこれを参考に配点して頂ければ。

↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
以下に、２つの情報を用意しました。
A：「2024年度日本技術士会の問題文」に対する「2024年の論文」
B：「2025年度日本技術士会の問題文」に対する「2025年の論文」

「2024年の論文」は、「日本技術士会の採点基準」に基づき、60点未満となる不合格となった論文です。
「日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき、「2024年の論文」と「2025年の論文」とではどちらが優れていますか？
尚、「論文」は1200文字以内で作成するルールであるため、1200文字以内に収まるように論文を作成することを優先し、必要な全ての事項を網羅的・具体的に記述していないことに注意してください。

「2025年の日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2025年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
----------------------------------------------------------------

「2024年の日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
「専門的学識」　５点
技術士が専門とする技術分野（技術部門）の業務に必要な、技術部門全般にわたる専門知識及び選択科目に関する専門知識を理解し応用すること。
技術士の業務に必要な、我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用すること。
「マネジメント」　５点
業務の計画・実行・検証・是正（変更）等の過程において、品質、コスト、納期及び生産性とリスク対応に関する要求事項、又は　成果物（製品、システム、施設、プロジェクト、サービス等）に係る要求事項の特性（必要性、機能性、技術的実現性、安全性、経済性等）を満たすことを目的として、人員・設備・金銭・情報等の資源を配分すること。
「コミュニケーション」　５点
業務履行上、口頭や文書等の方法を通じて、雇用者、上司や同僚、クライアントやユーザー等多様な関係者との間で、明確かつ効果的な意思疎通を行うこと。
「リーダーシップ」　５点
業務遂行にあたり、明確なデザインと現場感覚を持ち、多様な関係者の利害等を調整し取りまとめることに努めること。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8576]

論文評価の想定配点

Name：たこやき 2025/07/28(月) 13:41:37

AIによる論文評価を行うにあたり、コンピテンシの要求事項に基づき
配点を以下にように想定してみました。
必須、選択Ⅰ、選択Ⅱ-1、選択Ⅱ-2、選択Ⅲの評価それぞれの際に、
コンピテンシの配点項目を選定して、お使いください。

----------------------------------

①専門的学識：５点
　技術部門全般にわたる専門知識及び我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用しているか

②問題解決(問題解決)：５点
　　複合的な問題に対してこれらの内容を明確にし調査しこれらの背景に潜在する問題発生要因や制約要因を抽出し分析しているか。

③複合的な要求事項の考慮(問題解決):５点
　　複合的な問題に関して相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）それらによって及ぼされる影響の重要度を考慮しているか

④合理的な解決策の提示(問題解決)：５点
　　複数の選択肢を提起しこれらを踏まえた解決策を合理的に提案しているか。

⑤評価と波及効果(評価)：５点
　　業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資する内容か

⑥コミュニケーション：５点
　　業務履行上、口頭や文書等の方法を通じて、明確かつ効果的な意思疎通を行うことができる内容か。

⑦技術者倫理（技術者倫理）：５点
　　公衆の安全、健康及び福利を最優先に考慮した内容か

⑧持続可能性（技術者倫理）：５点
　　社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に資する内容か

➈リーダーシップ　：５点
業務遂行にあたり、明確なデザインと現場感覚を持ち、多様な関係者の利害等を調整し取りまとめることに努めること。

⑩マネジメント　：５点
業務の計画・実行・検証・是正（変更）等の過程において、品質、コスト、納期及び生産性とリスク対応に関する要求事項、又は　成果物（製品、システム、施設、プロジェクト、サービス等）に係る要求事項の特性（必要性、機能性、技術的実現性、安全性、経済性等）を満たすことを目的として、人員・設備・金銭・情報等の資源を配分すること。

----------------------------------

引用返信/返信削除キー

[8577]

Re: コンピテンシによる評価における想定配点

Name：鋼コン 2025/07/28(月) 15:02:16

去年オールBの論文でたこやきさんのプロンプトで今年の論文と比較しました。
(Ⅱ-2単体は不明ですが、Ⅱ-1がほぼ完ぺきに回答出来て間違いなくA相当なので7-10点程度と推定)
遊びすぎてo3が制限中のため、4oや4.1、o4miniで試しましたが、Ⅰ、Ⅱ、Ⅲ全ての論文で去年より大幅に改善しているとの評価を得ました。
あいかわらず採点も依頼すると8-90%や満点など景気の良い点数を出してくれますが(笑)
これもo3なら現実的な点数になるのでしょうか？
とりあえず今年勉強した成果は出せたと思いたい。

引用返信/返信削除キー

[8579]

Re: Re: コンピテンシによる評価における想定配点

Name：たこやき 2025/07/28(月) 15:38:36

実際にBランクだった過去の再現論文があるのであれば、AIにとっても、それをコンピテンシーに基づいた論文の良否の精度をあげることができますので、当然ながら、合合否の評価精度も高くなると思いますよ。

Ⅰ、Ⅱ、Ⅲ全ての論文で去年より大幅に改善しているとのこと。
よい評価結果で、よかったですね。

引用返信/返信削除キー

[8591]

Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：要望 2025/07/29(火) 08:46:14

現段階で完璧な採点をするプロンフトがあれば、技術士会の経費節減に貢献しますね。
合格論文を不合格にというのは、大手講座の再現論文評価と同じです。
講師による再現論文評価でも完璧はないでしょう。
ところで、sukiyaki塾では、再現論文評価を指定なのでしょうか。

引用返信/返信削除キー

[8592]

Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Name：たこやき 2025/07/29(火) 09:52:41

個人的には
何度も言うように、完璧な採点をするプロンプトがあり、かつ、例えば、高精度なCNN等のAIモデルがあったとしても、
「人が」その妥当性をきちんと判断することは、倫理的に責務として不可欠だと考えます。

引用返信/返信削除キー

[8599]

Re: Re: Re: コンピテンシによる評価における想定配点

Name：なめたけ 2025/07/29(火) 17:26:52

色んなAIに論文を投げてみました。感想として
・基本的に採点が甘く、本採点でまずあり得ない80～90点台が頻発する。論文と紐づいた実際の得点開示結果がABCのパターン分は必要そう。
・問題文と論文が別々な場合など、論文が問題文の題意から完全に逸脱、あるいは題意を無視していても50-60点程度で採点されてしまう。実採点での題意とのズレによる減点がどう評価されているのかが不明なため仕方ないが…
・設問毎に採点しているのか、各コンピテンシー毎に採点しているのかが不明(私の得点開示結果からは、途中までの論文でも採点されていたので前者？)
・実際には相対評価なので、得点調整をどう処理するか。（必須だけは択一だった時代もあるので絶対評価の可能性もある？）

引用返信/返信削除キー

[8601]

Re: Re: Re: Re: コンピテンシによる評価における想定配点

Name：たこやき 2025/07/29(火) 20:16:50

いったん私が貼り付けているプロンプト例を投げてみていったん結果を出力する。

その後、問題文の中から、「題意に相当する記述箇所」を個別に抽出した上で
論文において抽出した課題が、上記記述箇所の題意に適合したものか、解決策もしかり。
といった感じでか、個別に、問題文中の「題意」に対する論文の適合状況をを別途深堀して
AI解析させる。

といったステップでAI解析してみるとよいと思います。

コンピテンシーの採点基準も大事ですが、「題意に適合した内容か」が実際の論文評価の最重要事項だと思います。

そのため、これを意識して、題意箇所を個別に深堀しながら、AIによる評価を行うとよいと思います。

引用返信/返信削除キー

[8617]

Re: 論文評価の想定配点

Name：5回目 2025/08/01(金) 01:41:40

手元に必須20.5点の過去論文があったので、これを20点のベンチマークとしてchatgptO3で採点基準を逆算し、たこやきさんの採点基準を1点刻みで言語化してもらいました。
固有名詞を用いず、抽象的な記述にしてもらってます。
この採点基準で20.5点の論文を採点してもらうと、19点が多く、たまに18点や20点になりましたので、B判定かどうかを判定するのには役立つかもしれません。
grokを用いると30点台が出るので、実質chatgptのO3専用です。

技術士会の採点マニュアルがどんなものか分かりませんが、こんな感じのマニュアルに基づいて採点官の主観でざっくりと点数をつけているのかもしれませんね。
（各設問毎に採点しているとの説もありますが…）

① 専門的学識（知識の理解・応用）

1点：基礎概念や用語の理解に誤りが見られ、適用場面の認識も不正確です。

2点：基本用語の列挙にとどまり、前提・適用条件・限界の説明が不足しています。

3点：主要概念の理解は概ね正確ですが、実務への橋渡し（手順・要件・判断基準）が弱いです。

4点：専門知識を正確に適用し、前提や限界まで明示できています。相互関係の整理も良好です。

5点：複数領域の知を統合し、根拠に基づく適用・限界・代替案まで首尾一貫して示せています。

② 問題抽出・分析（原因・制約の把握）

1点：題意と異なる課題設定になっており、原因や背景が不明確です。

2点：課題は示すものの、原因・制約・影響の分解が浅く、根拠が弱いです。

3点：主要課題を整理し、基本的な因果は示せていますが、優先度の基準が曖昧です。

4点：多面的観点から具体的課題を抽出し、制約・利害を踏まえた優先度付けが妥当です。

5点：体系的な分析で定量・定性を統合し、意思決定に直結する診断ができています。

③ 複合的な要求事項の考慮（相反要件の扱い）

1点：単一視点に偏り、相反する要件の認識がありません。

2点：相反の存在には触れるが、比較や影響度の評価が行われていません。

3点：必要性・安全・経済性・実現性などを並列提示するが、重み付けやリスク評価が粗いです。

4点：代替案ごとに比較し、重み付け・リスク評価・選定理由を明確に示しています。

5点：シナリオ・感度分析まで踏み込み、利害関係者の受容性を含めた透明な判断基準を提示しています。

④ 合理的な解決策の提示（選択肢と実行性）

1点：解決策が題意とずれ、実現性が低いです。

2点：施策の列挙に終始し、優先順位・実行計画・資源見積がありません。

3点：複数案と概略の順序は示すが、体制・期間・必要資源・成功条件の具体性が不足しています。

4点：実行可能な組合せ案を提示し、短・中・長期の道筋とリスク対応を含めて構成されています。

5点：費用対効果・副作用・代替案の切替基準まで示し、選択の合理性が高い計画になっています。

⑤ 評価と波及効果（成果指標・学習）

1点：効果の評価や検証手段が示されていません。

2点：定性的効果のみで、指標・基準時点・測定方法が欠落しています。

3点：基本指標や評価時期は提示されるが、目標値やデータ取得方法が曖昧です。

4点：指標・目標・測定方法・改善の循環が具体的で、波及効果と副作用の両面を評価しています。

5点：外部比較や第三者評価も取り入れ、教訓化と展開の仕組みが確立されています。

⑥ コミュニケーション（構成・明瞭性）

1点：構成が不明瞭で論旨が飛び、意図が伝わりません。

2点：構成はあるが重複・曖昧表現が多く、主語・時制・数量の整合に欠けます。

3点：全体の流れは明快ですが、用語定義や前提の説明が一部不足しています。

4点：「誰が・いつ・何を・どの水準で」を明確に示し、読み手が実行像を描けます。

5点：簡潔で一貫性が高く、要点が先に示され、誤解の余地がほぼありません。

⑦ 技術者倫理（公益・安全・説明責任）

1点：公益・安全への配慮が不足し、遵守すべき原則への意識が薄いです。

2点：一般的配慮は述べるが、利害衝突への対処や説明責任の手順が示されていません。

3点：基本的配慮と手続は示されるが、判断の記録や検証の仕組みが限定的です。

4点：具体的ジレンマに対する判断手順・合意形成・第三者確認・記録が明確です。

5点：価値の衝突を定量・定性で評価し、透明性と追跡可能性が高い運用を提示しています。

⑧ 持続可能性（環境・社会・経済・長期性）

1点：短期最適に偏り、世代間・地域への影響配慮がありません。

2点：環境や社会に触れるが、評価軸や長期の視点が弱いです。

3点：環境・社会・経済の三側面に言及するものの、指標化やライフサイクルの観点が限定的です。

4点：ライフサイクル・循環・地域共生の指標を設定し、トレードオフと移行計画を示しています。

5点：長期のレジリエンスと循環性を数値で示し、外部性も含めた最適化の道筋が明確です。

引用返信/返信削除キー

[8628]

Re: Re: 論文評価の想定配点

Name：5回目 2025/08/04(月) 22:33:40

同様にo3でベンチマークから逆算したⅡ-1の採点基準です。

「採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
「1. 専門的学識（1～5点）
評価観点：設問適合性／理論の正確性／根拠の提示／規準・制度の理解と応用／具体性と網羅性
1点
設問意図から逸脱。主要概念の誤りが多く、根拠・指標の提示がほぼない。規準・制度の理解・応用が見られず、結論も不整合。
2点
設問の一部のみ対応。理論の不正確さや用語の混同があり、パラメータと性能の関係が断片的。規準・制度の解釈に誤りまたは不適切な適用。
3点
主要点には触れるが、関係性や根拠の明確化が不十分。式や指標の意味づけ・前提が曖昧。規準・制度の適用が限定的で、網羅性に欠ける。
4点
概ね充足。理論は正確で、パラメータと性能の関係も示すが、一部前提や適用範囲の記述が浅い。規準・制度への言及はあるが運用の留意が不足。
5点
完全充足。現象・原因・結果の因果が正確で、主要パラメータと性能の関係を明示。必要な式・指標・評価手順を適切に解釈し、規準・制度を条件に応じて適用。具体性・整合性ともに高い。
________________________________________
2. コミュニケーション（1～5点）
評価観点：構成の明瞭性／論理の流れ／簡潔さ（字数制約の遵守）／用語の適切さ／読み手配慮
1点
体裁・論理展開が不整で主旨が伝わらない。指示語乱用・曖昧表現が多く、字数制約も大きく逸脱。
2点
構成が不明瞭で要点が散在。前後の論理が飛ぶ、同義反復が多い。字数超過・不足や用語不統一が目立つ。
3点
基本構成はあるが段落間のつながりが弱い。重要度の整理が甘く、要点が埋もれがち。字数は守るが冗長さが残る。
4点
構成は明瞭で読みやすい。軽微な重複や冗長さはあるが概ね適切。字数管理・用語運用も良好。
5点
見出しや番号立てが明快で、冒頭から結論まで一貫。各段落が設問要求に直結し、過不足なく制限字数内に収まる。用語は一貫・正確、接続も適切で読み手が迷わない。

同様にⅡ-2です。
「採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
1. 専門的学識
1点：基礎概念の誤解が多く、論旨が技術的に成り立たない。
2点：理論の取り違えや用語の混同が散見。判断根拠が曖昧で、題意への適用が不十分。
3点：基本概念は正しいが、根拠や計算・照査の具体化が不足。結論は妥当だが確信度が低い。
4点：主要理論と判断指標を概ね正確に適用。細部の前提や限界の説明が一部弱いが、結論の妥当性は担保。
5点：題意に即した技術理論・基準の位置づけを正確に示し、根拠ある数値・判定条件・設計手順を一貫して適用。前提条件や限界も明記。
2. マネジメント
1点：計画性がなく、要求事項を満たす見通しが示されていない。
2点：工程や体制が抽象的で、リスクや制約条件の扱いが不足。
3点：手順や体制は示すが、資源配分・期間・コスト・リスクの統合が弱い。
4点：計画と実行手順、主要リスクと対策を提示。代替案比較は概略レベルだが意思決定は妥当。
5点：目的・範囲・制約を明確化し、計画→実行→検証→是正の循環を具体的な工程・資源配分・リスク対応・費用対効果で示す。代替案比較と選定理由が明快。
3. コミュニケーション
1点：目的・要点が伝わらず、意思疎通が成立していない。
2点：情報が断片的で、誤解や抜け漏れの恐れ。合意形成の計画が不足。
3点：説明は概ね理解可能だが、用語配慮や資料の工夫が限定的。合意手順が曖昧。
4点：対象者に応じた説明と必要資料を準備。合意形成の流れは概ね明確。
5点：利害関係者の特性を踏まえ、目的別資料・可視化・説明手法を使い分け、合意形成プロセス・記録・フィードバックを体系的に設計。
4. リーダーシップ
1点：指針を示せず、組織・協働を機能させられていない。
2点：受け身の姿勢が多く、調整や意思決定の主体性が乏しい。
3点：自ら方向性を示すが、判断基準やフォローアップが弱い。
4点：役割調整と意思決定を主として牽引。課題解決の道筋は明確だが、評価指標の具体性が一部不足。
5点：課題を定義し、優先度と判断基準を提示。役割分担を明確化し、対立解消・意思決定・是正を主導。成果指標と確認点を設定。

Ⅲは必須の技術者倫理と持続可能性を消せばよいかと思いますが、
問題文と論文に波及効果が無いと減点されたりするので、リスクや懸念事項懸案事項に場合は適宜修正しても良いかもしれません。

Ⅱ-1とⅡ-2は個別の点数がわからず、ほぼ完璧に書けたⅡ-1を8点とした場合の得点でそれぞれをベンチマークとしたので、精度はやや落ちると思います。

肌感覚として、openAI(o3)、gork3、copilot(ThinkDeeper)、Gemini(2.5pro)あたりを使うと、ⅠとⅢはかなりベンチマークのB論文に点数に近づきます。
今のところＢ論文に対してはcopilot(ThinkDeeper)がピタリ賞の確率が高いです。
合格点の3点のコメントが2.5点くらいの辛口なので、これでも少し甘いか・・・？

もし得点開示済みのＡ判定論文所持者の方いましたら、試してみてもらえるとありがたいです。

引用返信/返信削除キー

[8629]

★★★題意・採点基準・技術士法の要求事項の３視点の少し厳しめプロンプト例

Name：たこやき 2025/08/05(火) 09:41:11

「題意」「採点基準」「技術士法の要求事項」の３つの視点に基づく少し厳しめのプロンプト例を用意してみました。
各種生成AIを活用し、より厳格な評価を得たい方は、是非、試してみて下さい。
これは必須問題の場合の例です。

以下、プロンプト
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
以下の「日本技術士会の問題文」に対し、「論文」を作成しました。
この論文を以下の①②③の視点で採点し、100点満点中何点かの採点をしてください。
①「日本技術士会の問題文」に示された背景・キーワード・意図・求めていることを抽出した上で、これらに適合した内容かどうか
②「日本技術士会の採点基準」に適合した内容かどうか
③[選択科目をここにいれる]についての専門的学識及び高等の専門的応用能力に相当する幅広い知識と高等な専門技術の豊富な経験による総合的な判断能力を有する内容かどうか

尚、「論文」は1800文字以内で作成するルールであることと、３つの課題のうち、１つの課題に対する３つの解決策を書けばよいルールになっています。

「日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーー

「論文」
ーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
----------------------------------------

「日本技術士会の採点基準」
ーーーーーーーーーーーーーーーーーーーー
「専門的学識」
技術士が専門とする技術分野（技術部門）の業務に必要な、技術部門全般にわたる専門知識及び選択科目に関する専門知識を理解し応用すること。技術士の業務に必要な、我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用すること。

「問題解決」
業務遂行上直面する複合的な問題に対して、これらの内容を明確にし、調査し、これらの背景に潜在する問題発生要因や制約要因を抽出し分析すること。複合的な問題に関して、相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）、それらによって及ぼされる影響の重要度を考慮した上で、複数の選択肢を提起し、これらを踏まえた解決策を合理的に提案し、又は改善すること。

「評価」
業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資すること。

「技術者倫理」　
業務遂行にあたり、公衆の安全、健康及び福利を最優先に考慮した上で、社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に努め、技術士としての使命、社会的地位及び職責を自覚し、倫理的に行動すること。業務履行上、関係法令等の制度が求めている事項を遵守すること。業務履行上行う決定に際して、自らの業務及び責任の範囲を明確にし、これらの責任を負うこと。

「コミュニケーション」
業務履行上、口頭や文書等の方法を通じて、雇用者、上司や同僚、クライアントやユーザー等多様な関係者との間で、明確かつ効果的な意思疎通を行うこと。海外における業務に携わる際は、一定の語学力による業務上必要な意思疎通に加え、現地の社会的文化的多様性を理解し関係者との間で可能な限り協調すること。
ーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8641]

Re: ★★★題意・採点基準・技術士法の要求事項の３視点に基づく少し厳しめのプロンプト例

Name：なめたけ 2025/08/06(水) 13:30:08

必須建設Bの論文でたこやきさんの厳しめのプロンプトを試しました。
chatgpt(o3) 　76点
grok(3) 　　　77点
Gemini(2.5pro) 95点

Geminiはイレギュラーだとして、残り2つは同じほぼ結果となりましたが、甘めでした。
部門や論文の記述方法の違いで、プロンプトとの相性が悪かったかもしれません。

引用返信/返信削除キー

[8642]

Re: Re: ★★★題意・採点基準・技術士法の要求事項の３視点に基づく少し厳しめのプロンプト例

Name：たこやき 2025/08/06(水) 15:14:22

なめたけ様

情報提供ありがとうございます！
題意・採点基準・技術士法の要求事項の３つの視点に基づいた評価で
以下の高評価であれば、Aランクは期待できると思います！

chatgpt(o3) 　76点
grok(3) 　　　77点
Gemini(2.5pro) 95点

引用返信/返信削除キー

[8646]

Re: Re: 論文評価の想定配点

Name：なめたけ 2025/08/06(水) 17:56:16

5回目さんのものを検証しました。
建設必須でB判定となった論文です。
grokで合格になってしまいました。

chatgpt(o3) 　　　　　19/40点
grok(3) 　　　　　　　24/40点
copilot(Thinkdeeper)　16/40点

Gemini(2.5pro)は無課金で規制中のため未検証です。

引用返信/返信削除キー

[8647]

Re: Re: Re: 論文評価の想定配点

Name：たこやき 2025/08/06(水) 18:31:49

なめたけ様

貴重な情報提供ありがとうございます。
興味深い結果ですね。
grok4.0（https://oshiete.ai/で試用できます）の結果もご教示頂けると幸甚です。

恐れ入りますが宜しくお願いいたします。

引用返信/返信削除キー

[8651]

Re: Re: Re: Re: 論文評価の想定配点

Name：なめたけ 2025/08/07(木) 01:01:40

たこやき様
これ、同時にわちゃわちゃと動いてて面白いですね笑

5回目さんの採点基準にて、grok4を含め、改めて3つ試してみました。
B判定論文は20.5点ですので、おそらく20点か21点、19点か22点と思われます。
OpenAI o3　　　　19/40　
grok4　　　　　　23/40　
claude sonnet 4　24/40　

o3以外は甘めな印象。

おまけで私の2025の建設必須Ⅰ-2。
2勝1敗。AI的には少なくとも去年よりはレベルアップしているようです。
手ごたえも各設問で1-2点は加点できてほしいなという出来なので概ね一致。
今回必須のほうが自身がないので、Aと言われると素直にうれしいです。

OpenAI o3　　　　 23/40
grok4　　　　　　29/40
claude sonnet 4　　28/40

もう１つおまけで、たこ焼きさんの2024論文と2025論文を同時比較するプロンプトと5回目さんの採点基準を合体させて遊んでみました。
試行回数が1回ですが、2025の点数が単体版に比べてかなり上振れしました。
プロンプト内の「2024論文がB(不合格)」という情報が影響しているのか、はたまた文章量が多くなり解析が甘くなっているのかはわかりません(2024は据え置きなので前者？)。

OpenAI o3　　　　 23/40(2024)　　30/40(2025)
grok4　　　　　　　22/40(2024)　　32/40(2025)
claude sonnet 4　　17/40(2024)　　30/40(2025)

生成AI,試験が終わったあとの息抜きにいいですね。

引用返信/返信削除キー

[8652]

Re: Re: Re: Re: Re: 論文評価の想定配点

Name：たこやき 2025/08/07(木) 10:08:38

なめたけ様

貴重な情報提供を頂きありがとうございます。
興味深い結果ですね。
総じて、OpenAIO3の評価は厳格で解析水準が安定しているように思います。

なめたけさんの、いずれの生成AIの評価結果を踏まえると
2024論文に対し、2025論文の質が向上していることが
明白であることが読み取れますね。
３つの生成AIによる比較なので、サンプル数は少ないものの
標準偏差的・偏り的には小さいと思われ、A判定が期待できると思いますよ！

引用返信/返信削除キー

[8661]

Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Name：やまだ 2025/08/08(金) 09:56:07

去年の自作論文がないので、sukiyaki塾のA判定論文と比較してみました。
結果は、必須Iで5勝1敗、選択Ⅲは4勝2敗でした。
合格してますように。

引用返信/返信削除キー

[8662]

Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Name：たこやき 2025/08/08(金) 10:23:20

やまだ様
ありがとうございます。
できれば、どの生成AI及びバージョンをを使用したのか、〇勝〇敗のそれぞれの点数について
ご教示頂けますと幸甚です。
他の方の参考になるかと思います。
CHATGPTですと、評価が甘いのであまり参考になるかもしれませんが
OpenAIO3あたりですと、実際に近似するのではないかと思われます、
誠に恐れ入りますが何卒宜しくお願いいたします。

引用返信/返信削除キー

[8663]

Re: Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Name：やまだ 2025/08/08(金) 12:33:50

たこやき様
AIによる採点結果を、以下のとおり共有いたします。

必須I
　　　　2024 2025
OpenAI o3 77 81 勝ち
ClaudeSonnet Ex3.7 80 90 勝ち
Grok4 80 90 勝ち
DeepSeekV3 96 91 負け
GPT4.1 90 96 勝ち
Gemini2.5pro 86 96 勝ち

選択Ⅲ
　　　　2024 2025
OpenAI o3 83 87 勝ち
ClaudeSonnet Ex3.7 86 90 勝ち
Grok4 96 86 負け
DeepSeekV3 95 91 負け
GPT4.1 90 96 勝ち
Gemini2.5pro 90 96 勝ち

天秤AIを使って比較しました。見づらくて申し訳ございません。

引用返信/返信削除キー

[8667]

Re: Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Name：なりた 2025/08/08(金) 13:06:03

たこやきさんのプロンプトは24/40点のA論文が100点満点で何点くらいになるイメージですか？

引用返信/返信削除キー

[8668]

GPT5.0試作採点基準

Name：なめたけ 2025/08/08(金) 15:21:04

GPT5.0が出たので、5.0を制限まで使い倒して必須の採点基準を作ってみました。
かなり厳し目で、20点前後/40点の論文ではそう簡単にはA判定が出ないと思います。
5.0、5.0Thinking以外では未検証。

「採点基準」
(1) 課題抽出（10点満点）
0-1点：課題が1つ以下、観点なし、背景や関連なし。
2-3点：課題が2つ以下または4つ以上、観点不明確、背景や制約条件が断片的。
4-5点：課題3つで観点はあるが、背景または制約条件が一般的説明にとどまり、因果関係や活用する技術・方法との直接的関連が欠落。
6点（到達基準）：
・課題3つすべてに観点ラベルあり。
・各課題ごとに背景と主要制約（人員・予算など）を具体化。
・課題→制約→目標達成の遅延や効率低下の因果関係を明示。
・活用する技術や方法を特定し、課題との直接リンクを説明。
7点：上記に加え、課題間の優先順位と根拠、観点間の相互作用を説明。
8-9点：さらに、評価指標や適用範囲・前提条件を明示し、実務適用性を高めた分析。
10点：全要素を統合し、資源配分や代替案比較まで含めた高度な戦略的分析。

(2) 最重要課題と解決策（10点満点）
0-1点：最重要課題なし、解決策0ｰ1案。
2-3点：最重要課題はあるが抽象的、解決策が1案のみ。
4-5点：最重要課題と解決策2案以上はあるが、背景・制約条件や関係者視点・導入上の課題が欠落。
6点（到達基準）
・(1)から最重要課題を1つ選定し、解決策を2案以上提示。
・背景・制約条件・関係者視点・導入上の課題を具体化。
・最重要課題の選定理由は必須ではないが、未記載の場合は最大1点の減点対象。
7点：上記に加え、効果や費用の概要または実施の順序を提示。
8-9点：効果分析・導入上の課題・優先順位・長期的影響をすべて分析し、評価方法や展開時の設計まで含む。
10点：資源計画・持続運用策・代替案比較を統合し、選好理由まで明示した高度な提案。

(3) 波及効果・懸念事項と対策（10点満点）
0-1点：波及効果や懸念事項なし、または無関係。対策なし。
2-3点：波及効果や懸念事項はあるが抽象的で、背景や影響の説明なし。対策が漠然。
4-5点：波及効果または懸念事項を具体化し、背景や影響を説明。対策は単線的で、効果や限界の説明が不十分。
6点（到達基準）：
・少なくとも1つの波及効果や懸念事項を具体的に提示。
・背景・影響・対策を論理的に説明。
・対策の実行可能性や妥当性が明確。
7点：上記に加え、対策の効果や実行手順をより具体的に説明。波及効果・懸念事項と対策の因果関係を明示。
8-9点：内容が実務的かつ深く、背景・影響・対策の説明に加え、実施時の課題や副次的影響にも触れる。
10点：高度に体系化され、短期・長期の両面から影響と対策を分析。実施計画や評価指標まで含めた完成度の高い提案。

(4) 倫理・社会的持続可能性（10点満点）
0-1点：倫理や持続可能性なし。
2-3点：どちらか一方のみ、または両方が抽象的。
4-5点：倫理＋持続可能性に触れるが具体事例なし、責任範囲や判断基準不明確。
6点（到達基準）：
・倫理＋持続可能性＋具体事例を明示。
・社会的影響に関して論理的説明あり。
・一定の実務適用性が示されている。
7点：上記に加え、経済・社会・環境の3側面を統合的に説明。ただし影響評価や体系性不足。
8-9点：具体事例・責務・社会的影響を統合的に説明し、3側面のバランスに配慮。
10点：使命・責任・影響評価を体系化し、3側面を高度に統合。
________________________________________
加点要素（全設問共通）
・具体的かつ正確な数値データを用いた説明（例：時間短縮率、費用規模、対象範囲、人的リソース数）。
・定量的な比較や根拠の明示（例：導入前後の効率比較、被害軽減効果の試算）。
・根拠資料や事例の活用（出典や参照先が明確な場合）。

引用返信/返信削除キー

[8669]

Re: Re: Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Name：たこやき 2025/08/08(金) 16:01:01

山田様

ありがとうございます。
参考にさせて頂きます。
やはり、OpenAI o3が最も厳格な評価となりますね。
O3の点数が高いので、実際の評価も期待できるのではないかと思います。
宜しくお願いいたします。

引用返信/返信削除キー

[8670]

Re: Re: Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Name：たこやき 2025/08/08(金) 16:03:49

生成AIの種類とバージョンによります。
少なくともOpenAI O3ならば、60前後に近しい点数になると思いますよ.

引用返信/返信削除キー

[8671]

Re: GPT5.0試作採点基準

Name：たこやき 2025/08/08(金) 16:41:22

なめたけ様

情報提供ありがとうございます
GPT5.0使えるようになっていますね。
私も試してみましたが、GPTシリーズは、５であっても採点が甘い印象です。

私の場合、GPT5.0だと必須が95点となりました

引用返信/返信削除キー

[8672]

Re: Re: GPT5.0試作採点基準

Name：なめたけ 2025/08/08(金) 17:55:23

たこやきさん
たしかに5.0はo3より甘い部分はあると思います。
あと、5.0Thinkingと5.0にはあまり差を感じていません。
5.0の一番の問題点は、月額20ドルプランだと過去の4oやo3が選べなくなってる点ですね。
（選べたらごめんなさい）

ちなみに私の試作採点基準だと何点くらいになるか教えてもらえると嬉しいです。
色々試行錯誤して配点は単純に10×4に落ち着きましたが、
課題解決策=リスク必要な要件ってのはちょっと課題解決策を軽視しすぎてるような気がして…

引用返信/返信削除キー

[8673]

Re: Re: Re: GPT5.0試作採点基準

Name：たこやき 2025/08/08(金) 18:12:28

なめたけ様

ご返信ありがとうございます。
「私の試作採点基準」は、どれになりますでしょうか。。。汗
申し訳ございません。。

引用返信/返信削除キー

[8674]

Re: Re: Re: Re: GPT5.0試作採点基準

Name：なりたけ 2025/08/08(金) 19:08:45

たこやき様

8668の投稿になります。

引用返信/返信削除キー

[8678]

Re: Re: Re: Re: Re: GPT5.0試作採点基準

Name：たこやき 2025/08/08(金) 22:28:59

なめたけ様

ありがとうございます。
8668の「採点基準」を使用し、以下のプロンプトで必須問題の復元論文を採点してみました。
---------------------------------------
以下の「日本技術士会の問題文」に対し、「論文」を作成しました。
この論文を以下の①②③の視点で「採点基準」に基づいて採点をしてください。
①「日本技術士会の問題文」に示された背景・キーワード・意図・求めていることを抽出した上で、これらに適合した内容かどうか
②「日本技術士会の採点基準」に適合した内容かどうか
③[選択科目をここにいれる]についての専門的学識及び高等の専門的応用能力に相当する幅広い知識と高等な専門技術の豊富な経験による総合的な判断能力を有する内容かどうか
尚、「論文」は1800文字以内で作成するルールであることと、３つの課題のうち、１つの課題に対する３つの解決策を書けばよいルールになっています。

---------------------------------------

結果は次のとおりでした。
36点 / 40点

引用返信/返信削除キー

[8680]

Re: Re: Re: Re: Re: Re: GPT5.0試作採点基準

Name：なめたけ 2025/08/09(土) 00:56:40

たこやきさん

ありがとうございました。GPT5のThinkingですか？
すごいですね、全設問でほぼ満点ですね…自分もそんな論文を書けるようになりたいです。

試行回数増やしましたが、採点の甘さはGPT5>>o3≒GPT5Thinkingと思います。
20.5点論文がGPT5は19〜24（残念ながら合格点が出てしまいました），GPT5Thinkingが17〜20でした。やたら19点が多い。
o3は使えないので検証できていないですが、GPTThinkingと同等な記憶。
使いやすいGPT5で19〜22点に収束するような採点基準を作りたい。

引用返信/返信削除キー

[8681]

Re: Re: Re: Re: Re: Re: Re: GPT5.0試作採点基準

Name：なめたけ 2025/08/09(土) 00:59:19

失礼、文字化けしました。
20.5点論文がGPT5は19-24点，GPT5Thinkingが17-20でした。

引用返信/返信削除キー

[8684]

★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：たこやき 2025/08/09(土) 01:49:07

生成AIは、Ultra-deep thinking mode(超深層思考モード)という超高度解析モードがあります。

Ultra-deep thinking modeとは、通常の思考や分析よりもはるかに深く、広く、精緻に問題やテーマを掘り下げる思考スタイルやプロセスのことを指します。
具体的には、通常のGPTによる解析に対し、以下の超深層思考モードで解析をします。
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
1. 多層的・階層的な思考
表面的な事象の理解に留まらず、その背景にある構造や原因、価値観や前提、隠れた意図や文脈、さらにそれらがどう相互作用するか、までを複数のレイヤーで深堀する。
2. 学際的・横断的視点の導入
単一の専門領域に閉じず、哲学・倫理学・社会学・経済学・技術科学など、複数分野の知見を統合して分析・思考を行う。
3. 仮説設定と検証の反復
「なぜ？」「どうして？」を繰り返し問い、仮説を立てては検証し、思考の精度を高める。
4. 長期的かつ多角的視点での予測・洞察
現在の問題を時間軸やシナリオ軸で捉え、未来の可能性や波及効果を想像し、戦略的・倫理的な含意も考慮する。
5. 概念レベルでの抽象化と具体化の往復
具体的な事象やデータから普遍的な原理を抽出し、またその原理を個別事象へ適用し直すことで、理解を深める。
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

以下に、各生成AIで論文評価する際に、Ultra-deep thinking modeで解析するプロンプト例を掲示します。
プロンプトの中に、"ウルトラ・ディープ・シンキング・モードで、「論文」を採点して下さい"と追記するだけで、Ultra-deep thinking modenによる解析が実行されます。
GPT5.0、grok、OpenAIなどいずれの生成AIでも使えます。

以下は、Ultra-deep thinking modeで「必須」を採点する場合のプロンプト例となります。

↓↓↓↓↓

------------------------------------------------------------------------------------
以下の「日本技術士会の問題文」に対し、「論文」を作成しました。
「日本技術士会の問題文」の題意及び、「日本技術士会の採点基準」に基づき、
ウルトラ・ディープ・シンキング・モードで、「論文」を採点して下さい
この論文で記載した技術課題、解決策、波及効果、懸念事項、懸念事項への対応策、技術者倫理、持続可能性の内容について、「日本技術士会の問題文」で求められている題意にきちんと適合しているかもをおしえてください
採点においては、以下のどのランクなのかを示してください
A1：100～96点以上
A2：95～90点以上
B1：89～86点以上
B2：85～80点以上
C1：79～76点以上
C2：75～70点以上
D1：69～66点以上
D2：65～60点以上
E1：59～56点以上
E2：55～50点以上
F1：49～46点以上
F2：45～40点以上
G：39点未満

また採点時は以下に気を付けてください
・「論文」は1800文字以内で作成するルールであるため、1800文字以内に収まるように論文を作成しており
　必要な全ての事項を網羅的・具体的に記述していないこと。
・「論文」では、３つの課題のうち、１つの課題に対する３つの解決策を書けばよいルールになっていること。

「日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーー

「論文」
ーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーー

「日本技術士会の採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーー
「専門的学識」
技術士が専門とする技術分野（技術部門）の業務に必要な、技術部門全般にわたる専門知識及び選択科目に関する専門知識を理解し応用すること。技術士の業務に必要な、我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用すること。

「問題解決」
業務遂行上直面する複合的な問題に対して、これらの内容を明確にし、調査し、これらの背景に潜在する問題発生要因や制約要因を抽出し分析すること。複合的な問題に関して、相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）、それらによって及ぼされる影響の重要度を考慮した上で、複数の選択肢を提起し、これらを踏まえた解決策を合理的に提案し、又は改善すること。

「評価」
業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資すること。

「技術者倫理」　
業務遂行にあたり、公衆の安全、健康及び福利を最優先に考慮した上で、社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に努め、技術士としての使命、社会的地位及び職責を自覚し、倫理的に行動すること。業務履行上、関係法令等の制度が求めている事項を遵守すること。業務履行上行う決定に際して、自らの業務及び責任の範囲を明確にし、これらの責任を負うこと。

「コミュニケーション」
業務履行上、口頭や文書等の方法を通じて、雇用者、上司や同僚、クライアントやユーザー等多様な関係者との間で、明確かつ効果的な意思疎通を行うこと。海外における業務に携わる際は、一定の語学力による業務上必要な意思疎通に加え、現地の社会的文化的多様性を理解し関係者との間で可能な限り協調すること。
------------------------------------------------------------------------------------

引用返信/返信削除キー

[8686]

Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：初受験野郎 2025/08/09(土) 09:30:02

たこやきさんの超思考モードのプロンプトで建設部門必須1ー1をgrokで採点した結果、

C1 79点でした。

課題抽出をi-construction2.0のオートメーション3本柱で書いたので題意を外したかなと思っていましたが、ＡＩでは、深掘りは不足しているが題意に適合。との回答でした。

なかば諦めていましたが……なんだかいけそうな気がする〜⤴️

ちなみに同じプロンプトで、選択3-1を技術者倫理を除いて採点したら、

同じくC1 79点でした。

さすがにこのままの点数ではないと思いますが……なんだかいけそうな気がする〜⤴️

プロンプトありがとうございます。

引用返信/返信削除キー

[8687]

Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：結果待ち状態 2025/08/09(土) 10:05:46

私も早速復元論文を上記方法で採点してもらいました。その結果、全科目「C2：75～70点以上」との判定が出ました。新技術開発センターの復元論文添削では60点でしたので、合格できるかどうか微妙ですかね？他のAI診断では、85点以上でしたので、何が正しいのかわからない状態です。ただ、AI診断の中では、今回の採点が一番現実に近いのではないかと考えております。

引用返信/返信削除キー

[8688]

Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：なめたけ 2025/08/09(土) 11:38:40

たこやき様

ありがとうございます、早速使わせてもらいました。
超深層思考モードなんてものがあるのですね…

取り急ぎ結果だけ。
2回検証しました（PC、スマホアプリで1回ずつ）
20.5点論文　GPT5:92-93 GPT5Thinking:68-79
今年の論文 GPT5:88-93 GPT5Thinking:83-88

引用返信/返信削除キー

[8689]

Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：やん

2025/08/09(土) 14:33:35

たこ焼きさま。プロンプトありがとうございます。
今さらですが、R6年度の成績開示請求が返ってきたので
各生成AIでの評価を比べてみました。
実際の採点と比較しております。

問題文はR6年度　必須Ⅰ－２とⅢー２です。
受験部門、科目は「建設部門－道路」です。

※プロンプトについて、必須Ⅰは
「すべての解決策を実行しても新たに生じうるリスクとそれへの対応策」
に編集しています。

※選択Ⅲについては、加えて「技術者倫理」に関するコマンドを削除
しています。）

※詳しくないので、GPT5.0やo3というのはよくわかりませんでした。

結果として、好みの問題もあろうかと思いますが、
「Perplexity」が、バラツキが少なくランク差も±0.0だったので
一番よかったです。何かの参考になればと思います。

2949×1877 => 400×254

Book1-2.jpg/832KB

引用返信/返信削除キー

[8691]

Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：たこやき 2025/08/09(土) 22:28:06

なめたけ様

ありがとうございます。
超深層思考モードによるなめたけさんの結果をみると
通常モードよりも厳格な評価がされていることがわかりますね。

20.5点論文とは必須問題の結果として20.5点/40点ということでしょうか？？
その場合、100満点に換算すると、51.25点ですから、
超深層思考モードで68点ということは誤差が16.75。
例えば実際の答案では以下の減点もありうると思います。
・誤字、脱字による減点
・言葉の正誤による減点
・文法面のミス
・題意との乖離度合
などなど

これを踏まえると、超深層思考モードの採点結果から17点前後ほどを
差し引いた点数あたりで思っておけばいいのかもしれませんね。

なめたけさんは今年の論文が83-88とのことですのでAが期待できますね！

引用返信/返信削除キー

[8692]

Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：たこやき 2025/08/09(土) 22:36:55

やん様

貴重な情報提供ありがとうございます！
表の見方がいまひとつよく分かりません。。汗

R6年度の成績開示請求点数を表に明示してした比較表にして頂いた上で
No8574の想定配点バージョン（必須：40点満点、選択Ⅱ-1：10点満点、選択Ⅱ-2：20満点、選択Ⅲ：30満点）
で、比較検証を行って頂けますと大変助かります！　可能でしょうか？

あと、結果だけでいえば「Perplexity」は誤差が少ないということですね。
ありがとうございます。参考にさせて頂きます！

引用返信/返信削除キー

[8693]

Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：たこやき 2025/08/09(土) 22:50:40

結果待ち状態様

貴重な情報提供ありがとうございます！
各種AIはここで試用できますのでご参考までに。
https://oshiete.ai/

あと、No8574の過去のB判定論文と比較させたプロンプトをつかって
AIにB判定を定義づけた上で、評価させると、実際の評価に対する標準偏差を
小さくできるかとおもいます。

他投稿者様のご意見(過去論文の結果との比較に基づく)などを踏まえると
grok、OpenAIO3、Perplexityあたりの評価がしっくりくるようです。

引用返信/返信削除キー

[8694]

Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：なめたけ 2025/08/09(土) 23:45:34

たこ焼様

そうです、お恥ずかしながら必須で51%弱の得点率です。
51%論文をGPT5(Thinking)のたこやき様のUDTMで改めて5回採点を行ったところ、

74%、73%、74%、72点、73点でした。

また、別の年度ですが選択Ⅲでこちらも恥ずかしながら13点(43%)というギリギリB答案も持っているので、それもGPT5(Thinking)で試しました。
採点基準から技術者倫理を削除しています。

5回試しましたが、73%、74%、73%、72%、73%となりました。

結果として、51%論文と43%論文がほぼ同じ採点結果という悩ましい結果になりました。
私の採点結果は高得点の方のノイズになってしまうかもしれませんが、報告まで。

引用返信/返信削除キー

[8695]

Re: Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：たこやき 2025/08/10(日) 07:51:17

なめたけ様

ご返信ありがとうございます、
51%論文と43%論文をもっていらっしゃるので、以下のスクリプトを試してみて下さい
以下のスクリプトは、過去の不合格論文を使用して不合格水準を認識させたうえで、今回の論文の評価を行うスクリプトです。

-----------------------------------------------------------------
以下に、２つの情報を用意しました。
A：「2024年度日本技術士会の問題文」に対する「2024年の論文」
B：「2025年度日本技術士会の問題文」に対する「2025年の論文」

「2024年の論文」は、「日本技術士会の採点基準」に基づき60点未満となった不合格となった論文です。

「日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき、「2024年の論文」と「2025年の論文」とではどちらが優れていますか？
この論文を以下の①②③の視点で採点し、100点満点中何点かの採点をしてください。
①「日本技術士会の問題文」に示された背景・キーワード・意図・求めていることを抽出した上で、これらに適合した内容かどうか
②「日本技術士会の採点基準」に適合した内容かどうか
③[選択科目をここにいれる]についての専門的学識及び高等の専門的応用能力に相当する幅広い知識と高等な専門技術の豊富な経験による総合的な判断能力を有する内容かどうか

「論文」をウルトラ・ディープ・シンキング・モードで、「論文」を採点して下さい
尚、「論文」は1800文字以内で作成するルールであるため、1800文字以内に収まるように論文を作成することを優先し、必要な全ての事項を網羅的・具体的に記述していないことに注意してください。

「2025年の日本技術士会の問題文」
---------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇
---------------------------------------------------

「2025年の論文」
---------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇
---------------------------------------------------

「2024年の日本技術士会の問題文」
---------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇
---------------------------------------------------

「論文」
---------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇
---------------------------------------------------

「採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
①専門的学識：５点
　技術部門全般にわたる専門知識及び我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用しているか

②問題解決５点
　　複合的な問題に対してこれらの内容を明確にし調査しこれらの背景に潜在する問題発生要因や制約要因を抽出し分析しているか。

③複合的な要求事項の考慮:５点
　　複合的な問題に関して相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）それらによって及ぼされる影響の重要度を考慮しているか

④合理的な解決策の提示：５点
　　複数の選択肢を提起しこれらを踏まえた解決策を合理的に提案しているか。

⑤評価と波及効果：５点
　　業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資する内容か

⑥コミュニケーション：５点
　　業務履行上、口頭や文書等の方法を通じて、明確かつ効果的な意思疎通を行うことができる内容か。

⑦技術者倫理：５点
　　公衆の安全、健康及び福利を最優先に考慮した内容か

⑧持続可能性：５点
　　社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に資する内容か

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8697]

Re: Re: Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：なめたけ 2025/08/10(日) 12:38:58

取り急ぎ必須のみGPT5Thinkingにて検証しました。Ⅲは後ほど。
20.5点　57,58,57,54,57　平均56.6(22.5点相当)
2025年　74,78,77,78,78　平均77(31点相当)

とても自分の論文が30点台を取れてるとは思えない笑
20.5点が実際より5-6点(2点相当)ほど高く出ているので、
2025側を単純減とするか、はたまた比例させるか…
これでBだったら立ち直れないかも

実はたこやきさんの論文比較プロンプトはOpenAIo3で遊び倒したのですが、
私が検証した限り、o3では片方がBという情報があると、もう片方が単独採点より甘い採点になるという傾向が見られました。
GPT5Thinkingでは、明らかに単独採点時(80点台)より低くでているので、それは解消されていそうです。

今後の課題は、単独論文でABCを判定できる採点基準ですかね…
ABCの3パターンの開示結果があれば、ベンチマーク3つでかなり精度高い採点基準を作れそうなのですが、さすがにそれは現実的ではない笑

引用返信/返信削除キー

[8698]

Re: Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：やん

2025/08/10(日) 14:44:01

たこ焼きさま。わかりづらくて申し訳ありません。

一応、表の見方は各「生成AIの評価（ランク）」と
実際の「試験官の評価（ランク）」とのギャップを「ランク差」とした結果を
表現したつもりでした。

（例）ChatGPT→B1　試験官→A2　B1とA2を比較し、ランクが１つ下なので
　　「-1.0」と表現

プロンプトを編集して得点で再評価させました。（必須Ⅰのプロンプト例を下記に示してあります）

結論から申し上げると「バラバラ」でした。必須Ⅰの場合は、前回と同様
ChatGPTやPerplexityの精度が良かったのですが、

選択Ⅲとなると、GrokやGensparkの結果が精度良く「この生成AIが精度がいい」
といった結果はつかめませんでした。
「平均したら、精度がいい」という傾向もありませんでした。

※問題は同じR6年度　必須Ⅰ－２と選択Ⅲー２です。
受験部門、科目は「建設部門－道路」です。

やりながら心配だったのが『技術士に求められる資質能力(コンピテンシー)』は
口頭試験に関する評価事項も含めるため、
論文評価のプロンプトに、コンピテンシーをそのままコピペすると、若干誤差が出る
要因になるのではないかと思いました。
しかし、評価結果を見ると、実際の評価基準にはない「読みやすさ」「論理的な構成」
も考慮に入れている様子だったので、問題なかったです。

ただ、肌感覚としては生成AIも便利ですが、やはり利便性と品質はトレードオフで、
「生成AIに一存するリスクもある」という印象、人の目で見てもらうことも依然として大事だ、という感想でした。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
「2024年の論文」は、「日本技術士会の採点基準」に基づき、60点以上となる合格となった論文です。
最下段に示す採点基準を元に採点してください。

尚、「論文」は1800文字以内で作成するルールであるため、1800文字以内に収まるように論文を作成することを優先し、
必要な全ての事項を網羅的・具体的に記述していないことに注意してください。

「2024年の日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「採点基準」40点満点
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
①「専門的学識」　８点　全体で評価
技術士が専門とする技術分野（技術部門）の業務に必要な、技術部門全般にわたる専門知識及び選択科目に関する専門知識を理解し応用すること。
技術士の業務に必要な、我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用すること。

②「問題解決」　８点　（１）（２）で評価
業務遂行上直面する複合的な問題に対して,これらの内容を明確にし,調査し,これらの背景に潜在する問題発生要因や制約要因を抽出し分析すること。
複合的な問題に関して,相反する要求[、1.'il項(必要性,機能性,技術的実現性,安全性,経済性等),それらによって及ぼされる影響の重要度を考慮したうえで,複数の選択肢を提起し,これらを踏まえた解決策を合理的に提案し,又は改善すること。
８点中４点・・・課題抽出（１）に対する解答で評価
８点中４点・・・方策提起（２）に対する解答で評価

③「評価」　８点　（３）の解答で評価
業務遂行上の各段階における結果,最終的に得られる成果やその波及効果を評価し,次段階や別の業務の改善に資すること。

④「技術者倫理」　８点（４）の解答で評価
・業務遂行にあたり,公衆の安全,健康及び福利を最優先に考慮したうえで,社会,文化及び環境に対する影響を予見し,地球環境の保全等,次肚代にわたる社会の持続性の確保に努め,技術士としての使命,社会的地位及び職責を自覚し,倫理的に行動すること、
・業務履行上,関係法令等の制度が求めている事項を遵守すること.
・業務履行上行う決定に際して,自らの業務及び責任の範囲を明確にし,これらの責任を負うこと。

⑤「コミュニケーション」　８点　全体で評価
業務履行上、口頭や文書等の方法を通じて、雇用者、上司や同僚、クライアントやユーザー等多様な関係者との間で、明確かつ効果的な意思疎通を行うこと。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

1119×1051 => 400×375

1754804641.jpg/203KB

引用返信/返信削除キー

[8700]

Re: Re: Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：なめたけ 2025/08/10(日) 18:33:20

たこやき様

Ⅲの検証結果です。GPT5Thinkingを使用。
採点基準から技術者倫理と持続可能性を削除。
必須よりの採点が割れる結果に。

*43%　56,55,53,56,50(平均54.0%、16.0点相当)
2025　83,71,83,81,75(平均78.6%、23.5点相当)

また、B/C判定という事前情報が無いと、
低得点を低得点として評価するのはかなり難しいようです。
試しに問題文(必須2025)と論文(必須20.5点)をあべこべにして、
題意を外したとかそういう次元ではないような論文をプロンプトで採点しても
単独論文の採点であれば70点台などが出てしまいます。

引用返信/返信削除キー

[8701]

Re: Re: Re: Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Name：たこやき 2025/08/10(日) 20:00:39

なめたけ様

以下の点数を踏まえると、AIがB判定の特性を踏まえた上
での2025年論文の31点相当評価ですので、
少なくとも、①題意②コンピテンシ採点基準③専門応用力
の視点からみた合格水準を有した論文なのでしょう
素晴らしいと思います

20.5点　57,58,57,54,57　平均56.6(22.5点相当)
2025年　74,78,77,78,78　平均77(31点相当)

引用返信/返信削除キー

[8702]

Re: Re: Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：たこやき 2025/08/10(日) 20:40:28

やん様

ありがとうございます。参考にさせて頂きます。
比較表をみると、AI間の偏りが大きいですね。
AIは結局、特徴量に依存しますので、理想なのは、B判定やC判定の
サンプルが多ければ多いほど、評価因子の精度を高める
ことができるのですがね。。。汗

引用返信/返信削除キー

[8703]

Re: ★★★再現論文をAI評価する場合のプロンプト例

Name：AI初心者 2025/08/10(日) 21:20:46

AIは、否定しません。
辛口で採点するようなプロンプトって無いでしょうか。

引用返信/返信削除キー

[8704]

★★★ご協力依頼：減点要因抽出プロンプト例　(過去論文＋開示請求点数をおもちの方へ)

Name：たこやき 2025/08/11(月) 01:09:37

生成AIによる超厳格な採点を実現したく、
過去不合格論文の減点要因を、減点条件として盛り込んだプロンプトを作りたいと
考えております。

そこで、過去論文かつこれの開示請求点数をおもちの方に
ご協力依頼を申しあげます。

OpenAI03もしくはgrok(3.0以上)のいずれかを活用して
以下のプロンプトを生成AIで流して頂き、「開示請求点数」と、出力された「減点要因」の２点をセットで教えて頂けないでしょうか。
多くの受験生が閲覧されるこの掲示板のせっかくのスケールメリットを活かして、
上記２点を収集して、本プロンプトが完成できることを期待しております。

AIによる超厳格な採点、つまり、より実際に近い採点を実現するためには
「採点条件」に加え、プロンプトへの「減点条件」の定義(組み込み)だと考えます。

大変申し訳ございませんが何卒よろしくお願いいたします。

-----------------------------------
以下の「日本技術士会の問題文」に対し「論文」を作成しました。

日本技術士会では、以下の①②③の視点で採点されます。
①「日本技術士会の問題文」に示された背景・キーワード・意図・求めていることを抽出した上で、これらに適合した内容かどうか
②「日本技術士会の採点基準」に適合した内容かどうか
③[選択科目をここにいれる]についての専門的学識及び高等の専門的応用能力に相当する幅広い知識と高等な専門技術の豊富な経験による総合的な判断能力を有する内容かどうか

日本技術士会では、①②③の視点で採点された結果として、40点満点中24点以上であれば合格となります。
しかしこの論文〇点でした。

この論文が、24点とならず、〇点となってしまった減点要因を抽出して列挙してください
分析は、ウルトラ・ディープ・シンキング・モードで行ってください。

以下は、Ultra-deep thinking modeで「必須」を採点する場合のプロンプト例となります。

↓↓↓↓↓　以下必須の再現論文の場合の、減点要因抽出プロンプト例

------------------------------------------------------------------------------------

「日本技術士会の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーー

「論文」
ーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーー

「日本技術士会の採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーー
「専門的学識」
技術士が専門とする技術分野（技術部門）の業務に必要な、技術部門全般にわたる専門知識及び選択科目に関する専門知識を理解し応用すること。技術士の業務に必要な、我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用すること。

「問題解決」
業務遂行上直面する複合的な問題に対して、これらの内容を明確にし、調査し、これらの背景に潜在する問題発生要因や制約要因を抽出し分析すること。複合的な問題に関して、相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）、それらによって及ぼされる影響の重要度を考慮した上で、複数の選択肢を提起し、これらを踏まえた解決策を合理的に提案し、又は改善すること。

「評価」
業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資すること。

「技術者倫理」　
業務遂行にあたり、公衆の安全、健康及び福利を最優先に考慮した上で、社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に努め、技術士としての使命、社会的地位及び職責を自覚し、倫理的に行動すること。業務履行上、関係法令等の制度が求めている事項を遵守すること。業務履行上行う決定に際して、自らの業務及び責任の範囲を明確にし、これらの責任を負うこと。

「コミュニケーション」
業務履行上、口頭や文書等の方法を通じて、雇用者、上司や同僚、クライアントやユーザー等多様な関係者との間で、明確かつ効果的な意思疎通を行うこと。海外における業務に携わる際は、一定の語学力による業務上必要な意思疎通に加え、現地の社会的文化的多様性を理解し関係者との間で可能な限り協調すること。
------------------------------------------------------------------------------------

引用返信/返信削除キー

[8711]

Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：匿名 2025/08/11(月) 19:04:52

昨年度あたりから生成AIによる合否判定についてのトピックスが盛り上がっていますね。逆に言えば、技術士なんていなくても技術コンサルはAIに導いて貰うほうが確実で、技術士は公共事業受注に有利になるだけの存在になりうる可能性もあるわけですね。科学技術発展のためにはAIをいかに発展させていくかのほうが重要なのかもしれません。

引用返信/返信削除キー

[8712]

Re: ★★★ご協力依頼：減点要因抽出プロンプト例　(過去論文＋開示請求点数をおもちの方へ)

Name：なめたけ 2025/08/11(月) 22:05:38

たこやき様

20.5点論文の原因解析結果です。
AIの解答は問題文や論文中の固有名詞を避けた、抽象的・一般的な用語での説明とするよう指示しています。

まずは【OpenAI o3】
Ⅰ　問題文との適合性
答案では「観点を示したうえで課題を述べる」という設問の指示に対し、観点が提示された直後に背景説明が続くだけで、具体的に何が障壁となっているのかが十分に示されていなかった。さらに「迅速かつ効率的」というキーワードと「人員・予算が限られる」という前提に対し、優先度設定や代替資源の活用など実務的な踏み込みが弱いまま一般論で終わっている。最重要課題の選定も、三つの課題を大きく束ね直しただけで他の課題との優劣の理由や比較根拠が示されておらず、設問趣旨への応答として抽象的過ぎた。新たに生じ得るリスクは一項目しか挙げられておらず、情報セキュリティやデータ整合性など多面的なリスクが抜け落ち、網羅性が不足している。倫理と社会的持続性についても、専門職として遵守すべき条項や具体的手順に触れずに「公益を最優先」「安心・安全に遂行」と総論的に述べるにとどまった。

Ⅱ　採点基準への適合性
専門的学識の深度が十分ではなく、技術的手法や制度・標準の名称を避けたとしても、具体的な処理方法や数値的根拠を例示できていないため、専門家としての説得力が弱かった。問題解決プロセスも「現状→要因抽出→目標→代替案→比較→選択」という流れが整理されず、代替策の効果やコストを対比する説明がないまま複数案を羅列する形になっている。成果の評価方法やフィードバック手順がほぼ言及されておらず、改善サイクルを構築していることが示せていない。さらに、住民や行政機関など多様な関係者との合意形成・情報共有の視点が抜け落ちており、コミュニケーション能力の評価項目にも適合しにくい状況だった。

Ⅲ　高等の専門的応用能力
選択分野固有の詳細知見が薄く、適用条件や設計・運用上のパラメータ、期待される効果量などを示さなかったため、豊富な経験に基づく判断能力が十分に伝わらない。関連する法制度や指針をどう順守し、制約条件をクリアするかという説明も不足しており、制度面と技術面を統合した高次の提案になっていなかった。

Ⅳ　形式面
文字数の配分が抽象的な繰り返しに偏り、必須情報に割く余地が不足した。見出しと設問番号の対応も整理されておらず、採点者が答案構造を追いにくい。その結果、読みやすさや要点把握のしやすさでも減点対象となった。

Ⅴ　総括
大項目は網羅されているが、課題・リスクの具体化、専門技術と制度の深度、効果検証と倫理面の具体性が不足し、高度な専門的応用能力が十分に示されていない点が主な減点要因である。このため合格基準の二十四点に届かず二十点台前半にとどまったと推定される。

引用返信/返信削除キー

[8713]

Re: ★★★ご協力依頼：減点要因抽出プロンプト例　(過去論文＋開示請求点数をおもちの方へ)

Name：なめたけ 2025/08/11(月) 22:07:31

次に【Grok4】です。超長文ですが失礼。

以下は、ユーザーのリクエストに基づき、前の分析結果を修正したものです。箇条書きの点をすべて排除し、連続した段落形式で記述しています。分析の構造と深層思考プロセス（ウルトラ・ディープ・シンキング・モード）は維持しつつ、内容を一般的に再構築しました。減点要因は各視点内で流れのあるテキストとしてまとめています。

ウルトラ・ディープ・シンキング・モードの適用プロセス
問題の全体像把握（Macro-Level Analysis）として、まず問題文、論文、採点基準、視点①②③を全体として俯瞰し、論文の構造と内容を問題文の意図にマッピングして適合度を評価する。点数（20.5/40）が合格ライン（24/40）を下回る理由を、全体のバランス崩れとして仮定する。次に微細分解（Micro-Level Dissection）として、各問（(1)~(4)）ごとに分解し、問題文のキーワード（例: デジタル技術活用、復旧・復興、人員・予算限界、多面的観点、専門技術）を抽出し、論文の対応を逐一検証する。採点基準の各項目（専門的学識、問題解決、評価、技術者倫理、コミュニケーション）を論文に当てはめ、適合度を定量的に推定する。その上で因果連鎖分析（Causal Chain Exploration）として、各不適合点がなぜ減点につながるかを因果関係で深掘りし、例えば「浅い記述」が「専門的学識不足」を引き起こし、「視点③違反」となって「点数低下」に至るような潜在的なバイアス（例: 一般論多用、具体性欠如）を探求する。多角的視点統合（Multi-Perspective Integration）として、視点①②③をクロス検証し、例えば視点①の不適合が視点②の「問題解決」基準に波及するかを分析する。選択科目（ここではインフラ・建築物関連の技術分野を想定）を基に、専門的応用能力の欠如を強調する。定量的推定とシナリオ構築（Quantitative Estimation & Scenario Building）として、40点満点を基準に各部分の配分を仮定（例: (1)10点、(2)10点、(3)10点、(4)5点、全体適合5点）し、20.5点の内訳を逆算して減点要因を抽出する。合格ライン24点とのギャップ（3.5点分）を埋めるための「何が足りなかったか」をシミュレートする。最後に反省的フィードバック（Reflective Feedback）として、分析終了後、なぜこの論文が20.5点止まりなのかをメタ的に振り返り、改善示唆を付与する。

このモードにより、表面的な指摘を超え、深層的な減点メカニズムを抽出する。分析結果は、減点要因を視点①②③ごとに分類し、具体的な根拠と推定減点幅を記載する。総減点は20.5点の逆算に基づき、合計19.5点減（40-20.5=19.5）と仮定する。

全体評価の概要
総点数分析として、40点満点中20.5点は、基本的な構造遵守（例: 観点明記、複数解決策提示）でベース点（約25-30点）を稼いだものの、深み・具体性・適合性の欠如で減点されている。合格ライン24点とのギャップ（3.5点）は、主に「評価」基準の不在と専門的洞察の浅さによるものであり、論文は一般論が多く、問題文の「復旧・復興焦点」「人員・予算限界前提」「専門技術踏まえ」が十分反映されていない。強み（加点要因）として、構造が問題文に沿っている（観点明記、3課題抽出、複数解決策）点があり、デジタル技術の活用例がインフラ・建築物関連の技術分野らしい専門性を一部示している。一方、弱み（減点の全体像）として、事前対策寄りで復旧・復興の効率化が薄く、予算・人員限界が課題抽出で十分前提化されていない点が挙げられ、解決策が散漫で評価不在、倫理・持続性が表層的であるため、視点③の「高等な専門技術の豊富な経験による総合的な判断能力」が不足している。

減点要因の詳細抽出
減点要因を視点①②③ごとに分類し、各要因に根拠、影響する問題文/基準の箇所、推定減点幅（総19.5点減の内訳）を記載する。推定幅は、部分配点の仮定に基づく（例: (1)満点10点中減3点など）。

視点①として、「日本技術士会の問題文」に示された背景・キーワード・意図・求めていることを抽出した上で、これらに適合した内容かどうかを検討する（推定配分: 全体の30%、約12点分。実際得点推定: 7点 → 減5点）。この視点は、問題文の核心（大規模自然災害発生後の復旧・復興、デジタル技術活用、人員・予算限界、多面的観点、専門技術）をどれだけ抽出し適合させたかを問うもので、論文は形式的に適合するが、深層意図（「迅速・効率的復旧のためのデジタル技術」）を逸脱し減点されている。減点要因の1つ目は、課題抽出が復旧・復興焦点から事前対策に偏り、問題文の意図を十分反映していない点で、根拠として問題文は「発生後の復旧・復興を念頭に」と明記し事前対策は補助的であるのに、論文の課題と解決策は「事前対策と復旧対策」と混在し解決策では危険予測地図や情報発信ツールが事前対策寄りであり、キーワード「復旧・復興までの取組を迅速かつ効率的に」が薄く背景（最近の大規模自然災害等）の災害発生後の限界対応が希薄であることが挙げられ、影響として(1)の課題抽出と(2)の解決策で適合性低下を招き意図（効率的復興のためのデジタル技術）が抽出不足となり、推定減点幅は2点（課題抽出の適合性不足）である。減点要因の2つ目は、人員・予算限界を前提とした課題抽出が形式的で深く分析されていない点で、根拠として問題文は「投入できる人員や予算に限りがあることを前提に」と強調するのに論文の課題はコスト・人材面を挙げるが内容が一般論（人口構造変化の言及のみ）で具体的な限界（例: 災害発生後人員不足時のデジタル技術優先順位付け）への適合なしであり、キーワード「効率的・効果的に進めていく」が予算限界下の最適化として抽出されていないことが挙げられ、影響として多面的観点が表層的で問題文の求め（3つ課題の観点明記後内容示せ）が意図的に適合せず、推定減点幅は2点（前提条件の抽出不足）である。減点要因の3つ目は、(3)のリスク・対策が「全ての解決策実行しても生じうる」条件を十分満たさず新規性・適合性が低い点で、根拠として問題文は「すべての解決策を実行しても新たに生じうるリスク」と指定するのに論文のリスク（若手技術者の能力低下）は解決策の自動化から派生するが他の策（危険予測地図等）との連動が不明であり、背景（デジタル技術期待の高まり）に対する意図（復興効率化の副次的リスク）が抽出不足であることが挙げられ、影響として(3)の適合性低下を招き、推定減点幅は1点（リスクの包括性不足）である。

視点②として、「日本技術士会の採点基準」に適合した内容かどうかを検討する（推定配分: 全体の40%、約16点分。実際得点推定: 9点 → 減7点）。採点基準の5項目を基に評価し、論文は問題解決の一部を満たすが評価・コミュニケーションが弱く減点されている。減点要因の1つ目は、「専門的学識」の適合不足（法令・制度の理解応用が薄い）点で、根拠として基準は「技術分野全般の専門知識」「法令等の制度」を求めるのに論文のデジタル技術例（国土や都市のデジタルモデル化、建設作業自動化）はインフラ・建築物関連の技術分野らしいが応用が浅く（例: データプラットフォームの法令連携言及なし）であり、国固有の条件（気候変化・自然災害リスク）への専門応用が一般論止まりであることが挙げられ、影響として(2)(3)で専門知識の応用不足を招き、推定減点幅は2点である。減点要因の2つ目は、「問題解決」の適合不足（相反する要求の考慮・合理性提案が不十分）点で、根拠として基準は「相反する要求事項（安全性、経済性等）を考慮した複数選択肢・解決策」を求めるのに論文の解決策は複数挙げるが予算限界下の優先順位付けやトレードオフ（例: デジタル技術導入コスト vs. 復興速度）がなく合理性薄く、課題抽出も分析が浅く（制約要因の深掘りなし）であることが挙げられ、影響として(1)(2)で問題解決の深み不足を招き、推定減点幅は3点である。減点要因の3つ目は、「評価」のほぼ不在点で、根拠として基準は「結果・波及効果を評価し、次段階改善に資する」ことを求めるのに論文に評価要素（例: 解決策の効果測定、波及効果の定量分析）皆無であり(3)のリスクも評価的視点欠如であることが挙げられ、影響として全体で評価基準未達となり合格ラインとのギャップの主因であり、推定減点幅は1.5点である。減点要因の4つ目は、「技術者倫理」の適合が表層的点で、根拠として基準は「公衆の安全・福利最優先」「社会の持続性確保」「法令遵守」を求めるのに(4)は公益・持続性を挙げるが一般論で具体性なし（例: デジタル技術リスク時の倫理的決定プロセス未言及）であることが挙げられ、影響として(4)で基準適合低となり、推定減点幅は0.5点である。減点要因の5つ目は、「コミュニケーション」の明確性不足点で、根拠として基準は「明確かつ効果的な意思疎通」を求めるのに論文の表現は論理的だが冗長（例: 課題タイトルが長い）で専門用語の説明不足であり関係者間疎通の言及なしであることが挙げられ、影響として全体の文書品質低下を招き、推定減点幅は0点（軽微だが累積影響）である。

視点③として、[選択科目: インフラ・建築物関連の技術分野（一般化して想定）]についての専門的学識及び高等の専門的応用能力に相当する幅広い知識と高等な専門技術の豊富な経験による総合的な判断能力を有する内容かどうかを検討する（推定配分: 全体の30%、約12点分。実際得点推定: 4.5点 → 減7.5点）。この視点は、インフラ・建築物関連の技術分野の専門性（デジタル技術応用、復旧技術）と経験ベースの判断を求めるもので、論文は知識を示すが経験的深み・総合判断欠如で大幅減点されている。減点要因の1つ目は、幅広い知識の応用が浅く経験に基づく総合判断が不足点で、根拠として基準は「高等な専門技術の豊富な経験による総合的な判断」を求めるのに論文の解決策（建設作業自動化、デジタルモデル化）は知識ありだが経験的洞察（例: 過去災害での実務例、判断プロセス）なしでありリスクも専門技術（技術者能力向上制度の詳細応用）踏まえが薄いことが挙げられ、影響として(2)(3)で専門応用能力未達となり、推定減点幅は4点である。減点要因の2つ目は、高等な専門技術の統合性が低く選択科目の文脈で復旧・復興の効率化が不十分点で、根拠としてインフラ・建築物関連の技術分野ではデジタル技術（三次元データ活用、センサー等）が鍵だが論文は散漫（水害対策が技術分野外寄り）であり人員限界下の判断（例: デジタル技術優先投資の経験的分析）なしで総合判断（例: リスク対策の技術統合）が欠如であることが挙げられ、影響として全体で視点③違反となり合格ギャップの主因であり、推定減点幅は3.5点である。

総括と改善示唆
総減点内訳として、視点①:5点、②:7点、③:7.5点（合計19.5点減）であり、主な原因は「評価不在」「専門判断の浅さ」「復旧焦点の逸脱」で3.5点の合格ギャップを生んでいる。メタ的反省として、この論文は「形式遵守型」だが深層意図（復興効率化のデジタル技術最適化）を読み取れず経験ベースの洞察が不足しているため20.5点止まりである。改善策として、問題文キーワードを箇条書き抽出後各部に織り込み評価要素（効果測定）を追加し、専門例を経験談風に深掘りすれば24点超え可能である。

引用返信/返信削除キー

[8714]

Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：たこやき 2025/08/11(月) 22:40:07

匿名様

興味深いご感想かと思います。
私は、今後、人間とAIは、ほぼ区別がなくなっていくのではないかと考えています。
これのカギを握るのが、人間の身体性かなと思います。
人間ならでわの、何を感じとり、どのように駆り立てられるかの感性の世界です。

例えば、ときに則を超えるべき正しさだってあると思います。
制度はそうだが、それが人にとって幸せか。。みたいなものです。
そういったものはAIでは判断しかねるものかもしれません。

人間だけがもちうる人間の感性だと思うからです。

技術の世界でも、トロッコ問題のようなことはいくらでもあると思います。

ゆえに、今後、
高尚な倫理観、コンピテンシをもっているはずの技術士の価値が問われるのだと思います。

引用返信/返信削除キー

[8715]

Re: Re: ★★★ご協力依頼：減点要因抽出プロンプト例　(過去論文＋開示請求点数をおもちの方へ)

Name：たこやき 2025/08/11(月) 22:46:02

なめたけ様

ありがとうございます！
長文ですね～。。汗

とりあえずざっと斜読させて頂きましたが
いろいろ減点要因のヒントがちりばめられている気がします。
じっくり整理してみたいと思います。

まずはとりいそぎ、お礼まで！

引用返信/返信削除キー

[8811]

Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：なめたけ 2025/09/10(水) 17:02:33

通信講座からの2025復元論文の添削結果が返ってきたのでchatGPT5.0での採点結果と比較してみました。
GPT5.0で2024の得点開示結果(B判定)をベンチマークとして、2024問題文の題意と論文内容を分析し、ベンチマークの点数になった理由を分析させたうえで、2024と同じ採点基準で2025を採点しています。
講座の採点結果は講師2人の採点結果の平均値です。

配点はⅠが(1)15点(2)15点(3)5点(4)5点
　　　Ⅲが(1)(2)(3)各10点と通信講座側の配点に合わせています。

論文単体での採点はまだまだ難しいですが、通信講座の採点傾向に近くなるため、B判定の開示結果をベンチマークとしての採点はそこそこ有効に思えます(A,C判定をベンチとした場合はまだわかりません)。
また、AIの設問毎の採点傾向ですが、(1)(2)の課題解決能力と(4)技術者倫理が甘め、(3)リスクが厳しめな印象を受けました。

415×227 => 400×218

gpt5.0.png/10KB

引用返信/返信削除キー

[8815]

Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：たこやき 2025/09/11(木) 17:12:39

なめたけ様

ありがとうございます！
①過去B判定をベンチマークとした2025年論文のAI採点を実施(GPT5)
　AI採点では、ノーマル解析とThinking解析を実施
②2025年論文の講座採点を実施
③①と②を比較
ですね。

こんな貴重な情報を開示頂けるなんてとてもありがたいです！！
ありがとうございます！
基本的に講座の採点は低めですね。
あとは、講座採点の精度ですね。他トピックによれば、講座採点は、実際の合否に基づく
講座採点へのクレーム等を考慮し、意図的に低めに採点しているといった情報をみたことがあります。
とはいえ、講座採点は、一定の合格ラインのためのノウハウを保有している講師らによる採点なので
実際の採点には近似している採点になろうかと思います。
そうしますと、Thinking解析による採点結果に対し、－2点～－３点ぐらいの減点幅をみておけば
そこそこの現実的な見込みがみえてくるような気がしました。

もし可能であれば、余力がございましたら、O3やgrok4の数値比較もして頂けますと幸甚でございます。
ご無理申しまして大変申し訳ございませんが何卒宜しくお願いいたします。

引用返信/返信削除キー

[8817]

Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：なめたけ 2025/09/12(金) 09:52:32

たこやき様

o3,grok4も試しました。o3はGPT5とあまりかわらず、grok4はかなり甘めでした。

また、選択Ⅱも合計点(B)をベンチマークとして採点を行っています。
選択Ⅱは４つの論文と２つの採点基準を１つの文章にごちゃまぜしているせいか、thinking以外はⅡ-1,Ⅱ-2の得点配分が体感と合わず適当に思えました。
thinkingを使えばⅡ-1,Ⅱ-2の推定得点割合もある程度分析可能な気がします。

講座採点の感想ですが、自分の今年の手ごたえと比較すると、題意を外し気味の必須が少し甘く、選択は厳しい印象です。
特に選択はⅡの採点が厳しく、確認できる同一科目の受講者の最高点はⅡ-1が7点、Ⅱ-2が13点、総合で19.5点です。
Ⅱを18点以上とした割合は25%くらい、Ⅲは45%くらいなので明らかにⅡの採点は厳しいようです。
何年か前、あまり勉強しておらずⅡ-2を白紙で出した際にⅡ-1だけで7.5点のときがあったので、それと比較しても厳しいかなと。10万円を超える高額講座の受講生が中心なので、もう少し伸びてもよいかなという印象です。

ネットに後悔されている得点開示結果を見てもⅡの20点台は殆どいないようなので、合格率調整の相対評価は選択Ⅱで行っており、講師もそれを考慮しているのかな？と感じます。

991×227 => 400×91

1757638352.png/18KB

引用返信/返信削除キー

[8818]

Re: Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：たこやき 2025/09/12(金) 10:53:51

なめたけ様

ありがとうございます！
ご提示頂いた情報、すごいです。
なめたけさんのお手間と情報の価値を考えれば
これ、有償に相当する情報ですよ。

BASEやNOTEなどの、ECサイト作成サービスで有料で公開し
このトピには、リンクだけ貼っておいて、なめたけさんの今後の資質向上のための
資金づくりにされるのもよいのではないでしょうか

それくらい、価値のある情報だと思いますよ！！！

改めて、参考にさせて頂きます。本当にありがとうございます。

引用返信/返信削除キー

[8820]

Re: Re: Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：なめたけ 2025/09/12(金) 17:31:40

たこやき様

合格発表までの悶々とした不安と知的好奇心からやっているだけなのでお金を取るなんてとんでもないです。
ただ、受験生からしたら論文内容と実際の得点開示結果は咽から手が出るほど欲しいんですよね。合格したら2025の開示結果を含めて考えてみます(笑)

仮に今年駄目だった場合、開示結果をベンチマークとしたAI採点は論文作成に非常に役立つでしょう。
今後もAI進歩が止まらないでしょうし、技術士含め論文試験では必須のツールになっているかと思います。数年以内に人間による添削がいらなくなるかもしれませんね。
技術士試験もCBT移行(仮)に伴いAI採点に移行するかもしれませんね。

引用返信/返信削除キー

[8821]

Re: Re: Re: Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：たこやき 2025/09/12(金) 18:12:00

なめたけ様

今回のなめたけさんの分析内容は、なめたけさんがご苦労された体験と
これに基づき保有される情報資産があってこその内容です。
加えて、おそらく、今回の論文成果に対するAI解析において、過去再現論文・開示結果、今回の再現論文・講師による添削結果など、ここまで有効な情報を揃えておられる方は、あまりおられないと思いますので、ご提示の分析内容は、かなり貴重であると考えます。
有償はぜんぜんアリだと思いますよ！！

ともに合格できるといいですね～。

引用返信/返信削除キー

[8879]

★★★「必須＋選択1＋選択2＋選択3」の総合採点を行うプロンプト例

Name：たこやき 2025/10/10(金) 22:54:00

以下に４つの問題文とそれらに対する論文を用意しました
「問題文①」とこれに対する「論文①」
「問題文②」とこれに対する「論文②」
「問題文③」とこれに対する「論文③」
「問題文④」とこれに対する「論文④」

①②③④の「論文」に対する「論文の採点基準」の採点項目は以下のとおりです。
　①A・B・C・D・E・F・G・H
　②A・F
　③A・I・F・J
　④A・B・C・D・E・F

①が24点以上、かつ②と③を足して1８点以上、かつ④が18点以上であれば合格となりますが
合格でしょうか？
また論文の採点は、実際の採点者によりますが、以下の５項目は採点者の主観差の影響を受けにくい採点項目です。
この採点者の主観差の影響を受けにくい８つの採点項目の観点から、合格となる確率は何％でしょうか？
・論文①の内容が、問題文①の題意（ここに問題文の題意に相当する記述をいれる）に適合しているか
・論文②の内容が、問題文②の題意（ここに問題文の題意に相当する記述をいれる）に適合しているか
・論文③の内容が、問題文③の題意（ここに問題文の題意に相当する記述をいれる）に答えているか
・論文④の内容が、問題文④の題意（ここに問題文の題意に相当する記述をいれる）に適合しているか
・字数：指定字数を満たしているか
・文法・表記の正確性：誤字脱字、文法ミス、句読点、敬体・常体の統一など
・構成の明瞭さ：導入・本論・結論が明確か、段落構成が整理されているか
・論理の一貫：主張と理由、根拠と結論のつながりが成立しているか

「問題文①」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「論文①」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「問題文②」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「論文②」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「問題文③」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「論文③」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「問題文④」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「論文④」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「論文の採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
A：専門的学識（５点）
　技術部門全般にわたる専門知識及び我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用しているか
B：問題解決（５点）
　　複合的な問題に対してこれらの内容を明確にし調査しこれらの背景に潜在する問題発生要因や制約要因を抽出し分析しているか。
C：複合的な要求事項の考慮（５点）
　　複合的な問題に関して相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）それらによって及ぼされる影響の重要度を考慮しているか
D：合理的な解決策の提示（５点）
　　複数の選択肢を提起しこれらを踏まえた解決策を合理的に提案しているか。
E：評価と波及効果（５点）
　　業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資する内容か
F：コミュニケーション（５点）
　　業務履行上、口頭や文書等の方法を通じて、明確かつ効果的な意思疎通を行うことができる内容か。
G：技術者倫理（５点）
　　公衆の安全、健康及び福利を最優先に考慮した内容か
H：持続可能性（５点）
　　社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に資する内容か
I：マネジメント（５点）
業務の計画・実行・検証・是正（変更）等の過程において、品質、コスト、納期及び生産性とリスク対応に関する要求事項、又は　成果物（製品、システム、施設、プロジェクト、サービス等）に係る要求事項の特性（必要性、機能性、技術的実現性、安全性、経済性等）を満たすことを目的として、人員・設備・金銭・情報等の資源を配分すること。
J：リーダーシップ（５点）
業務遂行にあたり、明確なデザインと現場感覚を持ち、多様な関係者の利害等を調整し取りまとめることに努めること。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8880]

★★★「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行うプロンプト例

Name：たこやき 2025/10/10(金) 23:30:00

「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行う
プロンプト例もつくってみました。
プロンプトが長文なので、Grokで実行されるとよいと思います。

これは、過去再現論文とその結果を教え込ませて
AIに合否基準をもたせて上で、今回の論文の採点を行う方法となります。
プロンプト内の「以上／以下で合格／不合格でした」のところは、自身の過去論文の成績に合わせて変更してください。

↓↓↓↓↓↓↓↓↓以下プロンプト↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
以下に４つの問題文とそれらに対する論文を用意しました
「2025問題文①」とこれに対する「2025論文①」
「2025問題文②」とこれに対する「2025論文②」
「2025問題文③」とこれに対する「2025論文③」
「2025問題文④」とこれに対する「2025論文④」

論文の採点は、問題文の題意への適合度及び、以下を採点項目に基づいて評価されます。
　論文①：A・B・C・D・E・F・G・H
　論文②：A・F
　論文③：A・I・F・J
　論文④：A・B・C・D・E・F

論文①が24点以上、かつ論文②が６点以上、かつ論文③が12点以上、かつ論文④が18点以上であれば合格となります。

「過去論文①」は、「過去問題文①」の題意（ココに題意をいれる）及び「論文の採点基準」に基づき、40点中24点「以上・以下」で「合格／不合格」でした。
「過去論文②」は、「過去問題文②」の題意（ココに題意をいれる）及び「論文の採点基準」に基づき、10点中6点「以上・以下」で「合格／不合格」でした。
「過去論文③」は、「過去問題文③」の題意（ココに題意をいれる）及び「論文の採点基準」に基づき、20点中12点「以上・以下」で「合格／不合格」でした。
「過去論文④」は、「過去問題文④」の題意（（ココに題意をいれる）及び「論文の採点基準」に基づき、30点中18点「以上・以下」で「合格／不合格」でした。

その上で、その不合格要素となった論文の質を踏まえて、2025論文①・2025論文②・2025論文③・2025論文④は、過去論文①②③④の論文の合否基準及びその質を評価基準とした場合、2025問題文の題意及び「論文の採点基準」に基づくと合格するでしょうか。
なぜ合格である場合、なぜ合格水準を満たすのか過去論文の評価を踏まえてその根拠を示してください。
合格の確率も教えて下さい。

さて、2025論文①・2025論文②・2025論文③・2025論文④は、過去論文①②③④の論文の合否基準及びその質を評価基準とした場合、2025問題文の題意及び「論文の採点基準」に基づくと合格するでしょうか、また合格の確立も教えて下さい。

また論文の採点は、実際の採点者によりますが、以下の５項目は採点者の主観差の影響を受けにくい採点項目です。
この採点者の主観差の影響を受けにくい５つの採点項目の観点から、合格となる確率は何％でしょうか？
・題意適合性：問われたことに適合しているか
・字数：指定字数を満たしているか
・文法・表記の正確性：誤字脱字、文法ミス、句読点、敬体・常体の統一など
・構成の明瞭さ：導入・本論・結論が明確か、段落構成が整理されているか
・論理の一貫：主張と理由、根拠と結論のつながりが成立しているか

「2025問題文①」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「2025論文①」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

　「過去問題文①」
　-------------------------------------------------
　〇〇〇〇〇〇〇〇〇〇〇〇。。。
　-------------------------------------------------

　「過去論文過去①」
　-------------------------------------------------
　〇〇〇〇〇〇〇〇〇〇〇〇。。。
　-------------------------------------------------

「2025問題文②」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「2025論文②」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

　「過去問題文②」
　-------------------------------------------------
　〇〇〇〇〇〇〇〇〇〇〇〇。。。
　-------------------------------------------------

　「過去論文②」
　-------------------------------------------------
　〇〇〇〇〇〇〇〇〇〇〇〇。。。
　-------------------------------------------------

「2025問題文③」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「2025論文③」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

　「過去問題文③」
　-------------------------------------------------
　〇〇〇〇〇〇〇〇〇〇〇〇。。。
　-------------------------------------------------

　「過去論文③」
　-------------------------------------------------
　〇〇〇〇〇〇〇〇〇〇〇〇。。。
　-------------------------------------------------

「2025問題文④」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

「2025論文④」
-------------------------------------------------
〇〇〇〇〇〇〇〇〇〇〇〇。。。
-------------------------------------------------

　「過去問題文④」
　-------------------------------------------------
　〇〇〇〇〇〇〇〇〇〇〇〇。。。
　-------------------------------------------------

　「過去論文④」
　-------------------------------------------------
　〇〇〇〇〇〇〇〇〇〇〇〇。。。
　-------------------------------------------------

「論文の採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
A：専門的学識（５点）
　技術部門全般にわたる専門知識及び我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用しているか
B：問題解決（５点）
　　複合的な問題に対してこれらの内容を明確にし調査しこれらの背景に潜在する問題発生要因や制約要因を抽出し分析しているか。
C：複合的な要求事項の考慮（５点）
　　複合的な問題に関して相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）それらによって及ぼされる影響の重要度を考慮しているか
D：合理的な解決策の提示（５点）
　　複数の選択肢を提起しこれらを踏まえた解決策を合理的に提案しているか。
E：評価と波及効果（５点）
　　業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資する内容か
F：コミュニケーション（５点）
　　業務履行上、口頭や文書等の方法を通じて、明確かつ効果的な意思疎通を行うことができる内容か。
G：技術者倫理（５点）
　　公衆の安全、健康及び福利を最優先に考慮した内容か
H：持続可能性（５点）
　　社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に資する内容か
I：マネジメント（５点）
業務の計画・実行・検証・是正（変更）等の過程において、品質、コスト、納期及び生産性とリスク対応に関する要求事項、又は　成果物（製品、システム、施設、プロジェクト、サービス等）に係る要求事項の特性（必要性、機能性、技術的実現性、安全性、経済性等）を満たすことを目的として、人員・設備・金銭・情報等の資源を配分すること。
J：リーダーシップ（５点）
業務遂行にあたり、明確なデザインと現場感覚を持ち、多様な関係者の利害等を調整し取りまとめることに努めること。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8883]

Re: ★★★「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行うプロンプト例

Name：なめたけ 2025/10/11(土) 16:38:52

＞たこやき様

①開示結果なしと②開示結果ありの2パターンを試しました(試行回数1回)。
合格基準については、必須24点以上かつ専門36点以上と
少し改変しています。

パターン①開示結果なし
合否判定
①：30点 ≧ 24点 → 基準クリア
②＋③＋④：8＋18＋22 = 48点 ≧ 36点 → 基準クリア
結論：合格
「誰が採点しても合格」となる確率（見積り）
採点者間のブレ（各評価項目で±1点程度）の不確実性を仮定してロバスト性を評価すると、かなり厳しめに見積もっても
①：26-34点、②：7-9点、③：16-19点、④：19-24点といった帯に収まりやすい。
この場合でも ①≧24 かつ ②＋③＋④≧36 は維持される公算が高い。
①が24点を大きく割る、または②＋③＋④が36点を大きく割るには、複数項目で同時に大幅減点が必要。
以上を踏まえ、合格となる確率はおおむね 90% 程度と見積もります（前提：公平な標準的採点者、各項目のばらつき±1点程度）。

パターン②2024開示結果あり
結論から。

判定（私の採点）：合格見込み
└ 2025論文①＝27.5 / 40
└ 2025論文②＝7.0 / 10
└ 2025論文③＝14.5 / 20
└ 2025論文④＝20.5 / 30
└ 合否判定条件：論文①≧24 かつ（②＋③＋④）≧36 ⇒ 27.5≧24 且つ 42.0≧36 → 合格

合格確率（誰が採点しても合格となる確率の見積り）

前提：
各観点の採点ばらつきを**±0.5-1.0点/観点**と仮定（過去採点結果の幅や記述試験の一般的ばらつきに基づく経験的レンジ）。
その範囲で上下しても、①は24点ラインを概ね超過、②＋③＋④の合計も36点ラインを十分に超過する構図。
レンジ試算（保守的に下ぶれ側を想定）
①：25-30点程度
②：6-8.5点程度
③：13-16点程度
④：19-23点程度

②＋③＋④：38-47.5点 → いずれも36点を上回る公算大

→ 総合的にみて、合格に到達する採点者の割合はおおよそ 75-85%と見積もります。中心値をとると約 80%。
（主な減点の不確実性は、②の「耐荷力との関係」の数式・機構説明の薄さ、③・④の効果検証・KPIの不足です。）

やはり開示結果がないと甘めになるようです。
私はB判定をベンチマークとしていますが、C判定やA判定をベンチマークとした場合にどう影響するかは不明です。

パターン②の想定下限値くらいで滑り込みたいです(笑)

引用返信/返信削除キー

[8885]

Re: Re: ★★★「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行うプロンプト例

Name：たこやき 2025/10/11(土) 22:30:07

なめたけ様

こんばんは。
その後いかがお過ごしでしょうか。
合格発表まで、いよいよ1か月を切りましたね。
私は現在、口頭試験に向けた対策を少しずつ進めております。

夏頃より、なめたけ様とは幾度か交流の機会をいただいておりますが、
これまでに伺ったAI採点の状況から拝察するに、4つの論文すべてでA判定が頻出していることに加え、技術士講師による採点でも高く評価されているようですので、
非常に期待値が高いのではないかと感じております。

あとは、採点者の采配が勝負の鍵を握ると思うのですが、
少なくとも、以下の５点は、採点者の主観差を受けにくい部分だと思うので、この部分についてAIの評価が高ければ、期待値は高めかと思います。
・題意適合性：問われたことに答えているか
・字数：指定字数を満たしているか
・文法・表記の正確性：誤字脱字、文法ミス、句読点、敬体・常体の統一など
・構成の明瞭さ：導入・本論・結論が明確か、段落構成が整理されているか
・論理の一貫：主張と理由、根拠と結論のつながりが成立しているか

一方、表現の巧みさ、視点や着想の独自性、内容の深さや説得力、こういった部分などは、採点者の主観差を受けやすい箇所なのだろうと思います。

つまり、論文に対するAIの解析は、この「主観差を受けにくい＝ルールや基準で判断できる部分」が「どれだけ高い評価なのか」に着眼すべきだろうと思います。

昨年、OpenAIがまだO1の頃、私はO1による解析を行ったときに、継続的に60点以上を記録していたものはA評価、時折Bに下振れするものはB評価となっていました。
これは、今分析してみると、AIでAで実際にAだったものは、上記の「主観差を受けにくい箇所」についてAI評価が高かったものでした。
このような傾向から、AI解析における「主観差を受けにくい箇所」に重きをおけば、AI解析と実際の採点結果との間に、ある種の正規分布的な一致が見られるとすれば、AIによる評価の信頼性は比較的高いものと考えております。

なめたけさんもお時間があるようでしたら、AI解析において、この「主観差を受けにくい」箇所の評価をされてみるのもよいかもしれません。

というわけで、新しくご提示したプロンプトの２つめについて、「主観差を受けにくい箇所」を考慮した内容に修正してみましたので、よろしければご試用ください。
結果が出るまでは何とも言えませんが、
お互いに万全の準備をして、口頭試験に臨めるようにしていきたいですね。

引用返信/返信削除キー

[8887]

Re: Re: ★★★「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行うプロンプト例

Name：やまだ 2025/10/12(日) 13:21:55

たこやき様

たこやき様のプロンプトをいつも参考に使用させていただいております。

たこやき様やなめたけ様のように、周囲の利益となるような情報発信や、好影響を与えるような方々が技術士になるべきと感じます。

合格発表までは落ち着かない日々を過ごしておりますが、皆様の合格をお祈りしています。

引用返信/返信削除キー

[8889]

Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：FA 2025/10/13(月) 13:00:13

昨年、GPTで90点以上の評価は実際には70点、75点の評価が58点でしたが、
結果は合格でした。
AIの精度は上がっているかもしれませんが、精度は高くないと思います。
点数の評価もありますが、何らかの補正や人数調整があるかもしれないので、合否に直結する点数予測は難しいと思います。
合格者と不合格者のデータを積み重ねて精度を向上させることが必要かと思いますが、
現状は参考程度が望ましいと思いますよ。

引用返信/返信削除キー

[8890]

Re: Re: Re: ★★★「必須＋選択1＋選択2＋選択3」の。。。。

Name：たこやき 2025/10/14(火) 10:02:52

山田様

ご丁寧にありがとうございます。
皆さま、特にこの掲示板で交流させていただいた方々が、
同期としてご一緒に合格できることをを、心よりお祈り申し上げます。

引用返信/返信削除キー

[8891]

Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Name：たこやき 2025/10/14(火) 11:38:45

FA 様

貴重なご意見をいただきありがとうございます。
もちろん、みなさん、AI評価は
合否を左右する最終的な判断基準ではない程度に心得ているかと思います。

これは、
技術士二次試験の論文が論理性・実務経験・専門的判断の根拠といった技術士としての思考の質を重視しているため、AI評価だけでは測りきれない部分が多いからですよね。

加えて、
AIは文章の中の矛盾を見抜く力はありますが、
「内容の事実性」や「技術的妥当性」を深く検証する能力はまだ限定的だと思います。
故に、AIは“論理的虚構”にだまされやすい。
これが、AI評価が、「甘い採点」になる大きな理由だと私は考えます。

しかし。
「相対的傾向（どの部分が弱いか、強いか）」は極めて信頼性があると思います。

たとえば、AIが
「課題理解の部分が弱い」
「根拠の提示が抽象的」
「結論が再提示されていない」
と指摘した場合、それは高確率で実際の採点者も減点する部分です。

つまり、AI採点の点数そのものではなく、

“どの部分が評価され、どこが落とされるか”という分析が正しい活用法だと考えます。
これは、今回、祈願かなって口頭試験に進んだ場合（そうでない場合も）、AI評価を通じて、修正した思考力は非常に価値あるものになると思います

引用返信/返信削除キー

[8893]

【最後です】午前必須プロンプト：過去論文成績を評価軸とした実証的採点版

Name：たこやき 2025/10/17(金) 10:28:40

「過去再現論文」と「実際の成績」をベンチマークとする、
実証的採点版のプロンプトをつくりました。
いろいろ試行錯誤した最後のプロンプトです。

過去論文の実際の成績に基づいて、
それらの「低評価・高評価の特徴」をパターンとして抽出し、
「日本技術士会の採点基準」と併せて、実際の採点者による評価傾向を再現して
　採点するプロンプトです
つまり、”実際の採点者の判断構造”をある程度再現できると思います。
ウルトラシンキングモードで評価されるようにしています。

尚、以下などはAI評価の弱い点であることはご留意ください。
・この論文内容がなぜ今重要か
・どんな理論的背景や社会的文脈の中で意味を持つか
・それが今後の社会的方向性にどう影響を与えるか　　　　　など

ーーー午前必須プロンプト：過去論文成績を評価軸とした実証的採点版ーーーーーーーーーーー

以下に、２つの情報を用意しました。
A：「2024年度日本技術士会の問題文」に対する「2024年の論文」
B：「2025年度日本技術士会の問題文」に対する「2025年の論文」

論文は、40点満点中24点以上が合格となります。
「2024年の論文」は40点満点中24点[以上／以下」となり[合格／不合格]となった論文となります。
「2024年の論文」が「2024年の日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき
なぜ「合格／不合格]となったのかを「日本技術士会の採点基準」に基づき分析してください
その上で、それを基準として、「2025年の日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき、「2025年の論文」を採点して下さい。
ウルトラ・ディープ・シンキング・モードで、「論文」を採点して下さい

尚、「論文」は1800文字以内で作成するルールであるため、1800文字以内に収まるように論文を作成することを優先し、必要な全ての事項を網羅的・具体的に記述していないことに注意してください。
また、「2025年の論文」が合格水準の点数に達している場合に、合格水準の点数に達していることの決定的な論拠（誰が採点者であっても）を具体的に示してください。
また、採点において、「2025年の日本技術士会の問題文」の題意(ここに題意をいれる）に対し、適合性が高く高度な内容であることから高得点となっている論文中の記述箇所を抜粋してください（誰が採点者であっても）

「2025年の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2025年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「論文」
-ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「日本技術士会の採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
①専門的学識：５点
　技術部門全般にわたる専門知識及び我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用しているか

②問題解決５点
　　複合的な問題に対してこれらの内容を明確にし調査しこれらの背景に潜在する問題発生要因や制約要因を抽出し分析しているか。

③複合的な要求事項の考慮:５点
　　複合的な問題に関して相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）それらによって及ぼされる影響の重要度を考慮しているか

④合理的な解決策の提示：５点
　　複数の選択肢を提起しこれらを踏まえた解決策を合理的に提案しているか。

⑤評価と波及効果：５点
　　業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資する内容か

⑥コミュニケーション：５点
　　業務履行上、口頭や文書等の方法を通じて、明確かつ効果的な意思疎通を行うことができる内容か。

⑦技術者倫理：５点
　　公衆の安全、健康及び福利を最優先に考慮した内容か

⑧持続可能性：５点
　　社会、文化及び環境に対する影響を予見し、地球環境の保全等、次世代に渡る社会の持続性の確保に資する内容か

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8894]

【最後です】午後選択Ⅰプロンプト：過去論文成績を評価軸とした実証的採点版

Name：たこやき 2025/10/17(金) 10:30:16

「過去再現論文」と「実際の成績」をベンチマークとする、
実証的採点版のプロンプトをつくりました。
いろいろ試行錯誤した最後のプロンプトです。

過去論文の実際の成績に基づいて、
それらの「低評価・高評価の特徴」をパターンとして抽出し、
「日本技術士会の採点基準」と併せて、実際の採点者による評価傾向を再現して
　採点するプロンプトです
つまり、”実際の採点者の判断構造”をある程度再現できると思います。
ウルトラシンキングモードで評価されるようにしています。

尚、以下などはAI評価の弱い点であることはご留意ください。
・この論文内容がなぜ今重要か
・どんな理論的背景や社会的文脈の中で意味を持つか
・それが今後の社会的方向性にどう影響を与えるか　　　　　など

ーーー午後選択Ⅰプロンプト：過去論文成績を評価軸とした実証的採点版ーーーーーーーーーーー

以下に、２つの情報を用意しました。
A：「2024年度日本技術士会の問題文」に対する「2024年の論文」
B：「2025年度日本技術士会の問題文」に対する「2025年の論文」

論文は、10点満点中6点以上が合格となります。
「2024年の論文」は10点満点中6点[以上／以下」となり[合格／不合格]となった論文となります。
「2024年の論文」が「2024年の日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき
なぜ「合格／不合格]となったのかを「日本技術士会の採点基準」に基づき分析してください
その上で、それを基準として、「2025年の日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき、「2025年の論文」を採点して下さい。
ウルトラ・ディープ・シンキング・モードで、「論文」を採点して下さい

尚、「論文」は600文字以内で作成するルールであるため、600文字以内に収まるように論文を作成することを優先し、必要な全ての事項を網羅的・具体的に記述していないことに注意してください。
また、「2025年の論文」が合格水準の点数に達している場合に、合格水準の点数に達していることの決定的な論拠（誰が採点者であっても）を具体的に示してください。
また、採点において、「2025年の日本技術士会の問題文」の題意(ここに題意をいれる）に対し、適合性が高く高度な内容であることから高得点となっている論文中の記述箇所を抜粋してください（誰が採点者であっても）

「2025年の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2025年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の論文」
-ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「日本技術士会の採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
①専門的学識：５点
　技術部門全般にわたる専門知識及び我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用しているか

⑥コミュニケーション：５点
　　業務履行上、口頭や文書等の方法を通じて、明確かつ効果的な意思疎通を行うことができる内容か。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8895]

【最後です】午後選択Ⅱプロンプト：過去論文成績を評価軸とした実証的採点版

Name：たこやき 2025/10/17(金) 10:31:23

「過去再現論文」と「実際の成績」をベンチマークとする、
実証的採点版のプロンプトをつくりました。
いろいろ試行錯誤した最後のプロンプトです。

過去論文の実際の成績に基づいて、
それらの「低評価・高評価の特徴」をパターンとして抽出し、
「日本技術士会の採点基準」と併せて、実際の採点者による評価傾向を再現して
　採点するプロンプトです
つまり、”実際の採点者の判断構造”をある程度再現できると思います。
ウルトラシンキングモードで評価されるようにしています。

尚、以下などはAI評価の弱い点であることはご留意ください。
・この論文内容がなぜ今重要か
・どんな理論的背景や社会的文脈の中で意味を持つか
・それが今後の社会的方向性にどう影響を与えるか　　　　　など

ーーー午後選択Ⅱプロンプト：過去論文成績を評価軸とした実証的採点版ーーーーーーーーーーー

以下に、２つの情報を用意しました。
A：「2024年度日本技術士会の問題文」に対する「2024年の論文」
B：「2025年度日本技術士会の問題文」に対する「2025年の論文」

論文は、20点満点中12点以上が合格となります。
「2024年の論文」は20点満点中12点[以上／以下」となり[合格／不合格]となった論文となります。
「2024年の論文」が「2024年の日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき
なぜ「合格／不合格]となったのかを「日本技術士会の採点基準」に基づき分析してください
その上で、それを基準として、「2025年の日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき、「2025年の論文」を採点して下さい。
ウルトラ・ディープ・シンキング・モードで、「論文」を採点して下さい

尚、「論文」は1200文字以内で作成するルールであるため、1200文字以内に収まるように論文を作成することを優先し、必要な全ての事項を網羅的・具体的に記述していないことに注意してください。
また、「2025年の論文」が合格水準の点数に達している場合に、合格水準の点数に達していることの決定的な論拠（誰が採点者であっても）を具体的に示してください。
また、採点において、「2025年の日本技術士会の問題文」の題意(ここに題意をいれる）に対し、適合性が高く高度な内容であることから高得点となっている論文中の記述箇所を抜粋してください（誰が採点者であっても）

「2025年の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2025年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の論文」
-ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
「専門的学識」　：５点
技術士が専門とする技術分野（技術部門）の業務に必要な、技術部門全般にわたる専門知識及び選択科目に関する専門知識を理解し応用すること。
技術士の業務に必要な、我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用すること。
「マネジメント」：５点
業務の計画・実行・検証・是正（変更）等の過程において、品質、コスト、納期及び生産性とリスク対応に関する要求事項、又は　成果物（製品、システム、施設、プロジェクト、サービス等）に係る要求事項の特性（必要性、機能性、技術的実現性、安全性、経済性等）を満たすことを目的として、人員・設備・金銭・情報等の資源を配分すること。
「コミュニケーション」：５点
業務履行上、口頭や文書等の方法を通じて、雇用者、上司や同僚、クライアントやユーザー等多様な関係者との間で、明確かつ効果的な意思疎通を行うこと。
「リーダーシップ」：５点
業務遂行にあたり、明確なデザインと現場感覚を持ち、多様な関係者の利害等を調整し取りまとめることに努めること。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8896]

【最後です】午後選択Ⅲプロンプト：過去論文成績を評価軸とした実証的採点版

Name：たこやき 2025/10/17(金) 10:32:30

「過去再現論文」と「実際の成績」をベンチマークとする、
実証的採点版のプロンプトをつくりました。
いろいろ試行錯誤した最後のプロンプトです。

過去論文の実際の成績に基づいて、
それらの「低評価・高評価の特徴」をパターンとして抽出し、
「日本技術士会の採点基準」と併せて、実際の採点者による評価傾向を再現して
　採点するプロンプトです
つまり、”実際の採点者の判断構造”をある程度再現できると思います。
ウルトラシンキングモードで評価されるようにしています。

尚、以下などはAI評価の弱い点であることはご留意ください。
・この論文内容がなぜ今重要か
・どんな理論的背景や社会的文脈の中で意味を持つか
・それが今後の社会的方向性にどう影響を与えるか　　　　　など

ーーー午後選択Ⅲプロンプト：過去論文成績を評価軸とした実証的採点版ーーーーーーーーーーー

以下に、２つの情報を用意しました。
A：「2024年度日本技術士会の問題文」に対する「2024年の論文」
B：「2025年度日本技術士会の問題文」に対する「2025年の論文」

論文は、30点満点中18点以上が合格となります。
「2024年の論文」は30点満点中18点[以上／以下」となり[合格／不合格]となった論文となります。
「2024年の論文」が「2024年の日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき
なぜ「合格／不合格]となったのかを「日本技術士会の採点基準」に基づき分析してください
その上で、それを基準として、「2025年の日本技術士会の問題文」の題意及び「日本技術士会の採点基準」に基づき、「2025年の論文」を採点して下さい。
ウルトラ・ディープ・シンキング・モードで、「論文」を採点して下さい

尚、「論文」は1600文字以内で作成するルールであるため、1600文字以内に収まるように論文を作成することを優先し、必要な全ての事項を網羅的・具体的に記述していないことに注意してください。
また、「2025年の論文」が合格水準の点数に達している場合に、合格水準の点数に達していることの決定的な論拠（誰が採点者であっても）を具体的に示してください。
また、採点において、「2025年の日本技術士会の問題文」の題意(ここに題意をいれる）に対し、適合性が高く高度な内容であることから高得点となっている論文中の記述箇所を抜粋してください（誰が採点者であっても）

「2025年の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2025年の論文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の問題文」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「2024年の論文」
-ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
〇〇〇〇〇〇
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

「採点基準」
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
①専門的学識：：５点
　技術部門全般にわたる専門知識及び我が国固有の法令等の制度及び社会・自然条件等に関する専門知識を理解し応用しているか

②問題解決：：５点
　　複合的な問題に対してこれらの内容を明確にし調査しこれらの背景に潜在する問題発生要因や制約要因を抽出し分析しているか。

③複合的な要求事項の考慮：：５点
　　複合的な問題に関して相反する要求事項（必要性、機能性、技術的実現性、安全性、経済性等）それらによって及ぼされる影響の重要度を考慮しているか

④合理的な解決策の提示：：５点
　　複数の選択肢を提起しこれらを踏まえた解決策を合理的に提案しているか。

⑤評価と波及効果：：５点
　　業務遂行上の各段階における結果、最終的に得られる成果やその波及効果を評価し、次段階や別の業務の改善に資する内容か

⑥コミュニケーション：：５点
　　業務履行上、口頭や文書等の方法を通じて、明確かつ効果的な意思疎通を行うことができる内容か。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

引用返信/返信削除キー

[8897]

Re: 【最後です】午後選択Ⅲプロンプト：過去論文成績を評価軸とした実証的採点版

Name：なめたけ 2025/10/17(金) 15:54:44

たこやき様

早速プロンプト使わさせていただきました。
ウルトラ～とのことでGork(上級者モード、4?)を用いています。
Ⅱは個別配点が不明のため、かなり自信のあった2024のⅡ-1を7点と仮定しています。
(本採点では7割以上の得点率はそうそう出ないと聞いたことがありますが…)

Ⅰ　 29.0
Ⅱ-1 7.0
Ⅱ-2 16.5
Ⅲ 　24.0

Grokはあまり使っていませんでしたが、
GPT5よりは高めにでるかな？という印象です。

合格発表まであと3週間を切りました。
筆記結果報告トピにぜひドヤ顔で書き込みたいものです。

自分は来週RCCMを受けるので現時点では口頭試験対策に注力できていませんが、
まだまだ燃え尽きずに12月まで勉強を続けたいものです。

引用返信/返信削除キー

[8898]

Re: Re: 【最後です】午後選択Ⅲプロンプト：過去論文成績を評価軸とした実証的採点版

Name：たこやき 2025/10/17(金) 16:19:20

なめたけ様

安定した結果ですね。
何度か試行してみて、いずれもその水準以上を維持できる結果であれば
期待値大ですね！

RCCMを受けられるのですね。
私も１つ保有しておりますが、更新をさぼっており、いまは失効しております。。。笑

なめたけさんは、すでに技術士に求められる資質の１つ（資質向上の責務：常にその業務に関して有する知識及び技能の水準を向上させ、その他その資質の向上を図る）
の意識が高く、素晴らしいと思います。

口頭試験対策は、ココの情報、参考の１つにしております.
https://www.pejp.net/proffessional-engineer-examination/nijishiken_taikenki_jirei_touanrei/

引用返信/返信削除キー

[8899]

Re: 【最後です】午後選択Ⅲプロンプト：過去論文成績を評価軸とした実証的採点版

Name：やまだ 2025/10/18(土) 11:46:58

たこやき様

プロンプト使わせていただきました。

天秤ＡＩも使って７種類のＡＩで採点しましたが、やはりばらつきがありますね。

ＡＩによっては合格点ギリギリのものもあるので、１１月４日までは気持ちが休まりません。

みんなで合格して、技術者の高みを目指せるといいですね！

引用返信/返信削除キー

次の100件＞

[このトピックに返信]

[ HOME｜掲示板TOP｜ツリー表示｜一覧表示｜トピック表示｜新規投稿｜記事検索｜過去ログ｜携帯用URL ]

＜RSS＞ 【管理者へ連絡】

- Child Tree -

掲示板for技術士受験応援ページ

★★★本トピの要諦：最新の生成AIによる再現論文の評価について

★★★再現論文をAI評価する場合の プロンプト例

Re: Re: 最新の生成AIによる再現論文の評価

Re: 最新の生成AIによる再現論文の評価

Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: 最新の生成AIによる再現論文の評価

★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: 最新の生成AIによる再現論文の評価

Re: 最新の生成AIによる再現論文の評価

Re: Re: 最新の生成AIによる再現論文の評価

プロンプト、使わせていただきました！

Re: Re: 最新の生成AIによる再現論文の評価

Re: プロンプト、使わせていただきました！

Re: Re: Re: 最新の生成AIによる再現論文の評価

★★★2024版／2025年版論文のAI比較を行うプロンプト例（想定配点バージョン）

論文評価の想定配点

Re: コンピテンシによる評価における想定配点

Re: Re: コンピテンシによる評価における想定配点

Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: Re: Re: 最新の生成AIによる再現論文の評価

Re: Re: Re: コンピテンシによる評価における想定配点

Re: Re: Re: Re: コンピテンシによる評価における想定配点

Re: 論文評価の想定配点

Re: Re: 論文評価の想定配点

★★★題意・採点基準・技術士法の要求事項の３視点の少し厳しめプロンプト例

Re: ★★★題意・採点基準・技術士法の要求事項の３視点に基づく少し厳しめのプロンプト例

Re: Re: ★★★題意・採点基準・技術士法の要求事項の３視点に基づく少し厳しめのプロンプト例

Re: Re: 論文評価の想定配点

Re: Re: Re: 論文評価の想定配点

Re: Re: Re: Re: 論文評価の想定配点

Re: Re: Re: Re: Re: 論文評価の想定配点

Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Re: Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Re: Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

GPT5.0試作採点基準

Re: Re: Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Re: Re: Re: Re: ★★★2024版／2025年版論文のAI比較を行うプロンプト例（100点満点評価バージョン）

Re: GPT5.0試作採点基準

Re: Re: GPT5.0試作採点基準

Re: Re: Re: GPT5.0試作採点基準

Re: Re: Re: Re: GPT5.0試作採点基準

Re: Re: Re: Re: Re: GPT5.0試作採点基準

Re: Re: Re: Re: Re: Re: GPT5.0試作採点基準

Re: Re: Re: Re: Re: Re: Re: GPT5.0試作採点基準

★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: Re: Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Re: Re: Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: Re: Re: Re: Re: Re: ★★★Ultra-deep thinking mode(超深層思考モード)によるプロンプト例

Re: Re: Re: Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Re: ★★★再現論文をAI評価する場合の プロンプト例

★★★ご協力依頼：減点要因抽出プロンプト例 (過去論文＋開示請求点数をおもちの方へ)

Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Re: ★★★ご協力依頼：減点要因抽出プロンプト例 (過去論文＋開示請求点数をおもちの方へ)

Re: ★★★ご協力依頼：減点要因抽出プロンプト例 (過去論文＋開示請求点数をおもちの方へ)

Re: Re: ★★★本トピの要諦：最新の生成AIによる再現論文の評価について

Re: Re: ★★★ご協力依頼：減点要因抽出プロンプト例 (過去論文＋開示請求点数をおもちの方へ)

★★★再現論文をAI評価する場合のプロンプト例

Re: ★★★再現論文をAI評価する場合のプロンプト例

★★★ご協力依頼：減点要因抽出プロンプト例　(過去論文＋開示請求点数をおもちの方へ)

Re: ★★★ご協力依頼：減点要因抽出プロンプト例　(過去論文＋開示請求点数をおもちの方へ)

Re: ★★★ご協力依頼：減点要因抽出プロンプト例　(過去論文＋開示請求点数をおもちの方へ)

Re: Re: ★★★ご協力依頼：減点要因抽出プロンプト例　(過去論文＋開示請求点数をおもちの方へ)

★★★「必須＋選択1＋選択2＋選択3」の総合採点を行うプロンプト例

★★★「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行うプロンプト例

Re: ★★★「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行うプロンプト例

Re: Re: ★★★「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行うプロンプト例

Re: Re: ★★★「必須＋選択1＋選択2＋選択3」の総合採点(過去論文採点基準に基づく)を行うプロンプト例

Re: Re: Re: ★★★「必須＋選択1＋選択2＋選択3」の。。。。