G検定2020#2について
本記事を「見ておいてよかった。」「先にこの記事を見つけていれば。」等のコメントを頂いていることから、2020#2に対しても一定の効果はあったもの思われる。
G検定2020#3について
#1,#2と同様に法規、近年の動向に難易度がよっているのは同様。
G検定2021#1について
出題傾向としてはG検定2020#3を酷似したいた様子。
事前にいろいろ調査した方々は比較的に楽に解くことができ、そうでない人は恒例のテキスト、問題集とのギャップにやられたしまったという2極化が起きている。
G検定2021#2について
この回より、おおよその獲得点数率がわかるらしい。
日本ディープラーニング協会 事務局のメールを引用。
G検定の合格発表はこれまで合格/不合格しか開示しておりませんでしたが、今回より、個人ごとの分野別得点率と受験者全体の分野別平均得点率を開示することといたしました。また、不合格だった場合の合格得点率までのおおよそのポイント差も開示致します。開示情報が増えることにより、皆様の継続的な学びのサポートができれば幸いです。是非この機会にチャレンジしてください。
日本ディープラーニング協会 事務局のメールから抜粋
出題傾向は2021#1にかなり近かった様子。
個の回も事前にどれだけ情報収集できていたからで獲得点数が変わりそう。
G検定2021#3~2023#3
シラバスが変更になってからの2回目以降の試験。
傾向としては2021#2と同一。
G検定を受けてみた感想
まずは大まかな感想。
- ネット上の情報から感じた難易度よりも難しかった。
- 一応、年々難易度が上がっているという情報もあったので過去問、問題集だけでは対応できないとは思っていた。
- 公式テキスト、問題集等から得られる基礎的な知識だけでなく、現時点の新しい知識も求められる
- 強化学習あたりがテキスト、問題集ではあまり語られていない反面、出題数が多い印象
- 自然言語処理関連も予想よりも多い印象
- 2019年に流行ったBERT/transformerの影響?
- 法規関連が最初の方に大量に出てきて心を折れかけさせた
- 個人情報保護、匿名加工、自動運転。著作権、ドローン飛行規制、道路交通法改正(2020#2ではドローン関連問題は出なかったもよう。)
(2020#3ではXAI、営業秘密に関連する問題が増加) - 以下3要件がある。
- 秘密管理性
- 有用性
- 非公知性
- 個人情報保護、匿名加工、自動運転。著作権、ドローン飛行規制、道路交通法改正(2020#2ではドローン関連問題は出なかったもよう。)
- ちょっと意外な問題
- 三平方(ピタゴラス)の定理が出た。
- 確かにベクトルのノルムを算出する時には使うのでAIと無関係ということは無い。
- 三平方(ピタゴラス)の定理が出た。
- 出題数は214問/120分
- 1問あたり33.6秒程度、10問あたり5.6分、50問あたり28分
- よって、50問を20分で解くくらいのペース配分にして、分からないものは一旦切り捨てて後でググる
- 2020#2は200問/120分と問題数が減った。
- その分、難易度が上がったと思われる。
- 2020#3~2022#1は191問/120分
- 2020#3~,2022#1は問題数、問題傾向共に似ている。だいぶ落ち着いたか?
- 2024#6(11月)から160問/120分に。
- このタイミングで2021版シラバスから2024年版シラバスへ。
- 生成AIに関連するもの、経産省AI事業者ガイドラインに関連する用語が追加。
- 見た目上、それ以外も多く追加はされているが、追加と言うより明確化されたものという印象。
- このタイミングで2021版シラバスから2024年版シラバスへ。
- 1問あたり33.6秒程度、10問あたり5.6分、50問あたり28分
- 問題集を解きまくって反射的に答えを出すと言いう過学習方式は通用しない。
- 意図的に読んで頭にイメージを浮かべないと何を言っているのかわからない問題文になっている。
- 対策
- 既知の問題文を自分でドロップアウト(隠す場所を変えるとか)させて量産。それを持って自分の脳の汎化性能を引き上げておくと良い。
- Google検索用にマルチモニタ推奨。
- 可能であれば3画面で臨めると吉。
- Firefoxとchromeの両方のブラウザを入れて、片方をG検定用、もう片方を検索用。という使い分けもあり。
G検定(JDLA ディープラーニング ジェネラリスト検定)とは何か?
G検定(JDLA ディープラーニング ジェネラリスト検定)試験概要
私が説明するより、「日本ディープラーニング協会」のwebサイトを直接参照した方が良いでしょう。
一言でいうならば、
ディープラーニングの基礎知識を有し、適切な活用方針を決定して、事業活用する能力や知識を有しているかを検定する。
というもの。
- 基礎知識を有する。
- 活動方針を決定できる。
- 事業活用できる。
こういった人材を指してジェネラリトと呼ぶ。
G検定の過去も含めた合格率と難易度
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2017 | 1,500 | 1,448 | 823 | 56.87% |
2018#1 | 2,047 | 1,988 | 1,136 | 57.14% |
2018#2 | 2,745 | 2,680 | 1,740 | 64.93% |
2019#1 | 3,541 | 3,436 | 2,500 | 72.76% |
2019#2 | 5,387 | 5.143 | 3.672 | 71.40% |
これに対して、2020#1は以下になる。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2020#1 | ? | 6,298 | 4,198 | 66.66% |
合格率は見事に6が並んで・・・。(獣の数字?)
2019年が70%オーバーに対して、2020#1は66.66%と、やや難易度が高めと言える数値になっている。
3人の内2人が合格ということで、普通であれば難易度低めということになるが、受験者としては結構対策している人が多い気がするので、結構そぎ落とされてる印象にはなる。
合格点は公表されていないので、恐らくは合格率の調整が入っていると思われる。
よって、如何に平均より上に行くかが重要と考えて良い。
2020#2も似たような調整になると思う。なった。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2020#2 | ? | 12,552 | 8,656 | 68.96% |
どうも200問解き終えなくても合格ラインには乗るようなので、テキストベースで落としてはいけない問題を落とさず、そこからの深堀&拡大が出来ていれば基本的にはOKと思われる。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2020#3 | ? | 7,250 | 4,318 | 59.56% |
ここにきて、合格率が60%を切ってきた。
2020#2の合格発表後のTwitter上で
「ほとんど解けてないのに合格した。意味あるのかこの検定」
のような追及が多数有ったため、その影響なのか?
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2021#1 | ? | 6,062 | 3,866 | 63.77% |
再度、6割越え。
やはり、出題者側としては66.6%あたりを狙っていると思って良いだろう。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2021#2 | ? | 7,450 | 4,582 | 61.50% |
ここ3回はおおよそ似た傾向と言える。
出題範囲、難易度といろいろ蛇行してきた検定だが、だいたい落ち着いてきたので、
今後は比較的対策しやすい検定となっていくのだと思う。
尚、本試験を受けた同僚/部下の合格通知は以下。
(そのままの数字を載せるのはアレなので若干弄ってる。)
■合否結果
=================
【 合 格 】
=================
総受験者数 7,450名
合格者数 4,582名
■シラバス分野別得点率(小数点以下切り捨て)
1.人工知能とは.人工知能をめぐる動向.人工知能分野の問題:70%
2.機械学習の具体的手法:65%
3.ディープラーニングの概要:72%
4.ディープラーニングの手法:60%
5.ディープラーニングの社会実装に向けて:72%
6.数理・統計:45%
※総合得点率、設問個別の正解・不正解、本試験の合格ライン等は開示しておりません。あらかじめご承知おきください。
合格した中で一番獲得率の低いものをベースにしている。
何を言いたいかというと、6割取れていれば一応合格圏内と言える。
■合否結果
=================
【 不 合 格 】
=================
■あなたの合格正答率までのおおよそのポイント差
=================
【 A 】
=================
総受験者数 7,450名
合格者数 4,582名
【区分】[A:0%~10%]、[B:11%~20%]、[C:21%~50%]、[D:51%以上]
※合格ライン到達まであと何問程度正当する必要があったかを、問題セット全体に対する割合で表したものとなります。
■シラバス分野別得点率(小数点以下切り捨て)
1.人工知能とは.人工知能をめぐる動向.人工知能分野の問題:51%
2.機械学習の具体的手法:59%
3.ディープラーニングの概要:55%
4.ディープラーニングの手法:57%
5.ディープラーニングの社会実装に向けて:50%
6.数理・統計:39%
※総合得点率、設問個別の正解・不正解、本試験の合格ライン等は開示しておりません。あらかじめご承知おきください。
こちらは落ちた中で最も獲得率が高いパターン。
正答率5割ではやはり危険域ということになる。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2021#3 | ? | 7,399 | 4,769 | 64.45% |
久々に比較的高い合格率に。
この回は知人で受けた人数が少ないので、合格ラインは分かり難いが、
6割ではやや足りない可能性が高い。
恐らく6割中盤あたりがボーダーライン。
検定の問題傾向が落ち着きはじめ、対策が打ちやすくなったことで、全体の得点率が上がってきたのだと思われる。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2022#1 | ? | 6,760 | 4,198 | 62.10% |
この回は知人の受験者は1名だけなので情報がかなり少ない。
といあえず印象だけ聞いてみたところ、直近1年とは大きく変わっていないようである。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2022#2 | ? | 6,398 | 3,917 | 61.22% |
似たような傾向が続いている。
ちょっと気になる点としては、徐々に受験者数が減ってきている点?
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2022#3 | ? | 7,502 | 4,964 | 66.17% |
この回は11/4金、11/4土の2日開催(どちらか片方の日付を選んで受験)であったためか、少し受験者数も多めになっている。
合格率も久々の66%越え。
といっても問題が簡単になったわけではなさそう。
ネットや書籍による情報が増え、うまく対策できる下地ができてきたのかもしれない。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2023#1(3月) | ? | 7,150 | 4,705 | 65.80% |
2023#2(5月) | ? | 3,052 | 2,075 | 67.99% |
2023#3(7月) | ? | 4,518 | 3,106 | 68.75% |
2023#4(9月) | ? | 3,309 | 2,390 | 72.23% |
2023#5(11月) | ? | 5,330 | 3,662 | 68.71% |
2024#1(1月) | ? | 3,291 | 2,398 | 72.87% |
2024#2(3月) | ? | 5,527 | 3,760 | 68.03% |
2024#3(5月) | ? | 3,044 | 2,236 | 73.46% |
2024#4(7月) | ? | 4,130 | 3,080 | 74.40% |
2024#5(9月) | ? | 4,917 | 3,689 | 75.03% |
2022年までは3月、7月、11月の年3回開催だったが、
2023年からは3月、5月、7月、9月、11月の年5回開催。
2024年からは1月、3月、5月、7月、9月、11月の年6回開催。
3月、7月、11月に関しては金曜日、土曜日の2日開催になっている。
1月、5月、9月は従来ではなかった開催日且つ1日開催であるため、受験者薄は半数以下。
合格率にはそれほど影響してい無さそうだが、2023#4は70%オーバーになっている。
いろいろ情報が出回っているため、皆うまく対策しているのだろう。
開催日 | 申込者数 | 受験者数 | 合格者数 | 合格率 |
---|---|---|---|---|
2024#6(11月) | ? | 6,850 | 5,027 | 73.39% |
2024#6(11月)から2024年版新シラバスに変わったタイミングとなる。
しかし、合格率を見るとそれほど影響は無かった様子。
新シラバスに変わったと言っても、
生成AI関連用語が増えた以外はどちらかというと「明確にシラバスに記載された」ものが多いので、
実質的には影響なかったと思われる。
(統計検定3級程度の部分の明確化とAI事業者ガイドライン発行による明確化がされ学習しやすくなった)
G検定は文系でも合格可能か?
良く聞かれる質問ではある。
結論としては文系、理系はあまり関係ないので十分可能。
理由は以下。
- 数学的解釈が必要な項目は少ない。
- 2,3問あるかないか
- どちらかというと歴史や法規に紐づく問題が多い。
言い回しが理系的なだけであって、
実際の内容は歴史、法規の性質が強いため、
実は文系の方が向いているような気がする。
私個人としては
「文系でも受かるG検定」というよりも、
「理系でも受かるG検定」という書籍の方が必要なのでは?
と思ったりする。
※ 当然インパクトの無いタイトルなので売れないでしょうが。
G検定を受けるモチベーション
人によっては目的が無いと頑張れない人いるかと思う。
私もその一人であり、G検定を受ける上のモチベーションありき。
ちなみに私の「G検定を受けるモチベーション」は、
AI関連の案件受ける際のコミュニケーションに必要な知識の獲得。
昨今のAIブームに乗っかり、個人的に既存のアルゴリズムを試したりはしてるが、
全体像を把握しているわけではない。
これが災いしてか、ちょっとしたAI、機械学習の用語が拾えないということもシバシバ。
そもそも言葉を知らないとか、成り立ちを知らないというのが、
結構案件獲得に対して印象を悪くしていた。
これを払拭するために、G検定を受験することを決めた。
つまり、「AI関連知識の全体像と基礎を押さえたい」という部分になる。
これ以外にも様々なモチベーションは考えられる。
- AI関連技術者になるための基礎知識を身に着けたい。
- AI関連事業を興したい。
- 自社の作業効率化にAIを導入したい。
etc
G検定対策前の私のスペック
- 趣味でDNNを少しかじってる。
- 「ディープラーニングの概要」の8割程度の知識
- 「ディープラーニングの手法」の5割程度の知識
- 「ディープラーニングの研究分野」の4割程度の知識
- 上記の絡んでニューラルネットワーク以外の機械学習も知識レベルで少し保有
- 「機械学習の具体的手法」の3割程度の知識
- 微分積分、ベクトル、行列に対しては特に抵抗感は無い。
つまり、素の状態では214問中60問程度で正答率28%程度だったと言える。
これが知識ゼロからスタートする方と比較した際の私のアドバンテージとなる。
微分積分、ベクトル、行列に関して。
問題としてはそれぞれ1問出るか出ないか程度なので、この部分ではアドバンテージはなし。
G検定対策の学習時間
G検定に向けての対策は試験日から2週間前から開始。
一日の学習時間は通勤時間の学習も合わせて2時間程度。
つまり、28時間の学習時間となる。
しかし、正直28時間では不足だったと認識している。
下で紹介している白本、黒本、AI白書をじっくりやって1周しかできず、正直言って知識として定着したかはあやしい。
よって、私と同様に一日に2時間程度しか学習時間を割り当てられない方は試験日1ヶ月前から学習開始して白本、黒本、AI白書を2周した方が良い。
G検定対策として学習に使用した本(テキスト、問題集、時事)
※ 2024年11月より新シラバスに移行しているため、テキスト、問題集も2024年以降のものを選択した方が吉。新しければ良いというわけでもないのが悩ましい・・・。
いわゆる白本と黒本。加えてAI白書。
私の場合は白本側でガッチリと全体像を捕まえて黒本とAI白書で随時補強していく方針で実施。
正直、白本だけでは今回のG検定の問題の半分も解けない。
黒本加えれば半分は解けそう。
AI白書の補強分でやっと6割越えだったかと。
ディープラーニングG検定公式テキスト(通称白本)
白本の第2版が出版されたもよう。(2021年5月11日)
当然、こちらで学習した方が良いだろう。
差分としては、Self-Attention、Transformer、BERT、GPTの明確に追加されていた。
白本の第3版が出版されてもよう。(2024年6月2日)
生成AIに付随する情報が増えているように見える。
Diffusion Model、基盤モデル&転移学習&ファインチューニング関連、マルチモーダル、モデルの軽量化(蒸留、プルーニング、量子化)などなど
徹底攻略 ディープラーニングG検定 ジェネラリスト問題集(通称黒本)
こちらも第3版が出版されたようす。
新しい方が良いだろう。
徹底攻略ディープラーニングG検定ジェネラリスト問題集 第3版(通称、黒本)
AI白書
※ 試験中に検索することを想定するとKindle版の方が良いかも。
あと、松尾 豊 先生の「人工知能は人間を超えるか ディープラーニングの先にあるもの」は読んでおいた方が良い。
白本と被る内容は多いが、シナリオとして認識する文系脳の方は相性が良いかと。
短時間でさらっと勘所を捕まえたい場合ははマンガで読むのもあり。
私は持ってないが、AIカルタで学習というのも、取っ掛かりとしては面白いかもしれない。
(G検定頻出ワードを多数収録。JDLA推薦商品。って書いてあった。)
あと、たまたま本屋で立ち読みした本だが、以下などは比較的昨今のG検定の内容を踏襲しているように見受けられた。
BERT/transformer、XAI(Explainable AI:説明可能なAI)についても触れらていたので、今後のG検定の対策としては有効と思われる。
G検定2021#1に於いて8割方網羅されてたと言われる
「最短突破 ディープラーニングG検定(ジェネラリスト) 問題集」
だから大丈夫。とはならないあたりが厄介ではあるが。
2024年以降のテキスト問題集。
・ディープラーニングG検定(ジェネラリスト)最強の合格テキスト[第2版] [徹底解説+良質問題+模試(PDF)]
・ディープラーニングG検定(ジェネラリスト)最強の合格問題集[第2版] [究極の332問+模試2回(PDF)] (まっすぐ合格シリーズ)
ディープラーニング関連の法律、倫理に関する書籍。
タイトル通り、G検定をターゲットとしている。
テキスト、問題集では拾えてない領域をカバーしているので、流し読みだけでもしておいた方が良さそう。
Kindle Unlimitedの利用
Kindle Unlimitedによる\0の書籍を利用するのもあり。
最近は\0のG検定対策本が結構出ている。
Kindle Unlimited自体が月額\980なので本当の意味では\0とは言い難い。
しかし、30日間の無料期間があるので、G検定受験の1か月前に無料登録をして、G検定対策本を読み漁ってから解約という手も使えなくはない。
(Amazon的には迷惑かもしれないが・・・。)
学習のコツ(出題者側の思考)
出題者側の思考を考えてみるのが手っ取り早い。
出題者に課せられた重大ミッションはおおよそ以下になる。
- 合格点はおおよそ〷点にしたい。(たとえば60点)
- 勉強していない受験者を即行で切りたい。
- 上記に伴い、合否を二極化(または三極化)したい。
しかし、普通に出題すると、平均点を中央値とした正規分布になる。
この合格ラインはかなりのボリュームゾーンで、1点の差で合否が分かれる人が多発する。
正直、この状態は避けたい。
よって、以下のような分布したいというのが人情。
よって、ボリュームゾーンを35点と75点とした、ふた山の分布が望ましい
この場合、60点以上を取らせるためには、過去の問題や巷に流れている問題集から出題用の問題を持ってくる。
つまり、「この問題解いた事ある!ラッキー」ではなく、
「ヤバイ。出題者に解かされている!この問題は絶対落とせない」と考えるべきとなる。
これがほとんど解けない場合は、不合格確定。
次に二極化についてだが、
勉強してきた受験者の傾向も2つに分かれる。
- 問題集をベースに慣らしてきた。(たぶん、8割の人間はこっち)
- 情報を構造化して知識として定着してきた。(のこり2割はこっち)
G検定の場合、合格率66%を狙っているようなので、
前者の半分くらいを合格させる難易度に設定してくる。
つまり、問題集等で語られてはいるが、ちょっと論点、視点をずらす問題を散りばめてくることが予想できる。
これも半分は解けるようにしておかないと少し危険域に入る。
このような受験者の分布を散らしたいという出題者側の思考には注意しておいた方が良い。
合格ライン上で団子状態になるのは、出題者側からすると確実にさけたいはずなので。
そもそもとして、後者の「知識として定着」であれば全く問題は無い。
真のG検定対策
これは意外と盲点になってるのかもしれないが、実はG検定のシラバスに出題される題材が全部記載されている。
ななめ読みするとわかるが、公式テキスト、黒本等の問題集にも載っていない単語が結構ならんでいるはず。
よく、G検定受験後に公式テキストで語られていない問題が出ていることをSNS上で激怒している方々を見受けられるが、その事実は本来受験後のセリフではなく、シラバス確認後に発すべきセリフである。
単に情報収集不足にしか見えないというのが本音である。
つまり、このシラバスを読まずしてテキスト、問題集、チートシートに走ると結構不利な状態になる。
(試験当日に聞いたことも無い単語の連発に心をくじかれる)
最初にシラバスを読み、学習が進んだところでまたシラバスを読み返し、試験直前もシラバスを2,3回読み返すくらいはやっておいた方がよい。
シラバスがJDLA公式のカンペになっているはずである。
もうちょい言うと、試験後にもシラバス見ておくのもおすすめ。
シラバスはJDLAの以下のサイトの一番したでPDFとして公開されている。
(URLが変わるかもしれないので、その場合はJDLAのサイトから探してください。)
ちなみに、常にG検定に対するクレームの的になる、法律系、最新動向系は
「ディープラーニングの社会実装に向けて」
というカテゴリの話となる。
これを見た感じだと、これから外れた問題はそうそう出てはおらず、そういう意味ではクレームをつけるほどの話ではないと思う。
カンペ(カンニングペーパー、チートシート)について
まず、JDLA的にカンペ(カンニングペーパー、チートシート)を使ったりGoogle検索で答えるのは推奨されてはいない。
禁止が明言されているわけではないが、一般常識と範囲としてそうなってるはずである。
しかし、Web試験という性質上、実質的には許容されているといったところ。
で、カンペ(カンニングペーパー、チートシート)の要否については、用意する分にはOKだと思う。
使う使わないかは本人お任せではあるが、カンペを作ると結果的に脳内で情報が整理されるので、
本番に於いてはカンペに書いたものはカンペを見なくても解ける。という事象が発生する。
これを理由にカンペ作成のみ推奨。
一応、本記事の後ろの方に私が作成したカンペ画像を貼っているので、カンペ作成予定の方は参考にどうぞ。
たぶん、巷のカンペ、チートシートを謳ってるサイトよりもまとまってるかも・・・。
少なくとも単語だけをまとめたカンペはG検定に対しても、合格した後に対しても
あまり意味のあるカンペの作り方では無いというのが私の認識である。
NoteとかでG検定のカンペを販売しているのをたまに見かけるが、
他人が作ったチラ裏カンペを買うのにどれほどの意味があるのかも正直言って疑問。
(ネガキャンではございませぬ。)
あと、一問を37秒のペースで解くG検定の場合、
他人が作ったカンペから出題部分を拾い上げる時間はそもそも無いとも思ってる。
というわけで、良し悪し以前にカンペによる対策は相性があまりよろしくない。
次のページへ
次に無料模試や無料講座によるG検定対策について
コメント
It’s hard to find educated people about this subject, however, you seem like you know what you’re talking about!
Thanks