掲示板for技術士受験応援ページ
[
HOME
|
掲示板TOP
|
ツリー表示
|
一覧表示
|
トピック表示
|
新規投稿
|
記事検索
|
過去ログ
|
携帯用URL
]
[7398]
Re: Re: 生成AI推定による採点基準と配点(選択科目U-2)
Name:湯豆腐 2024/10/16(水) 19:36:40
鋼コン さん
GPT4oの平均点をみる¥と、いずれも合格基準以上ですね。
目安とはいえ、一定のレベルは担保できているのではないかと推察いたします。
A判定の復元論文は、分野に限らず、インターネット上に公開されている
サンプルがあったりしますので、これで採点精度を測ってみるとよいかと思います。
A判定の復元論文でも、厳しめの結果になります。
匠さんの技術士向け動画でいわれていましたが、匠さんのの塾生の再現論文と
合否の傾向からみるに、A判定の復元論文でも正規分布的に、大半が、
合格点より少し上くらいに収束しているようです。
要するに、二次試験の採点は、どんな論文であろうと採点は厳しめだということです。
。
ちなみに、私が提示した「生成AI版の採点基準と配点」は、過去の私のTUVの
B判定論文について、それぞれ4割の点数(Tなら16点/40点、Uなら8点/20点、Vなら16点/30点)
と設定して解析して算出したものです。
(上記のB判定が”実際に”何点だったかは知りません)
つまり、私が提示した「生成AI版採点基準」の内容自体が、そもそも厳しめのものなのです。
以上を踏まえると、鋼コン さんの、GPT4oによるTUVの平均点は、実際の採点精度に
近しい、あるいはそれに十分に相当する点数と判断してもよいのかもしれません。
「ちなみに4.0の最低点は通信講座の採点結果と概ね一致しています。」
これがその根拠となりうるものかと。
あと3週間。合格となることをお祈りしております。
記事引用
削除キー
編集
削除
返信無し
上記ツリーを一括表示
/
上記ツリーをトピック表示
題 名
本 文
名 前
E-Mail
削除キー
(半角8文字以内)
文字色
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
ファイル
≪アップロード可能なファイル種類≫
\n/
.gif
/
.jpg
/
.jpeg
/
.png
/.txt/.lzh/.zip/.mid/.pdf
≪アップロード可能なファイル容量≫
6000KB
(1KB=1024Bytes)以内 6) スレッド内の合計ファイルサイズ:[0/6000KB]
残り:[6000KB]
プレビュー
[
HOME
|
掲示板TOP
|
ツリー表示
|
一覧表示
|
トピック表示
|
新規投稿
|
記事検索
|
過去ログ
|
携帯用URL
]
-
Child Tree
-
GPT4oの平均点をみる¥と、いずれも合格基準以上ですね。
目安とはいえ、一定のレベルは担保できているのではないかと推察いたします。
A判定の復元論文は、分野に限らず、インターネット上に公開されている
サンプルがあったりしますので、これで採点精度を測ってみるとよいかと思います。
A判定の復元論文でも、厳しめの結果になります。
匠さんの技術士向け動画でいわれていましたが、匠さんのの塾生の再現論文と
合否の傾向からみるに、A判定の復元論文でも正規分布的に、大半が、
合格点より少し上くらいに収束しているようです。
要するに、二次試験の採点は、どんな論文であろうと採点は厳しめだということです。
。
ちなみに、私が提示した「生成AI版の採点基準と配点」は、過去の私のTUVの
B判定論文について、それぞれ4割の点数(Tなら16点/40点、Uなら8点/20点、Vなら16点/30点)
と設定して解析して算出したものです。
(上記のB判定が”実際に”何点だったかは知りません)
つまり、私が提示した「生成AI版採点基準」の内容自体が、そもそも厳しめのものなのです。
以上を踏まえると、鋼コン さんの、GPT4oによるTUVの平均点は、実際の採点精度に
近しい、あるいはそれに十分に相当する点数と判断してもよいのかもしれません。
「ちなみに4.0の最低点は通信講座の採点結果と概ね一致しています。」
これがその根拠となりうるものかと。
あと3週間。合格となることをお祈りしております。