AI、データサイエンス ディープラーニングのテクニック その2 ディープラーニングの有名どころのモデルとしてCNNについて記載する。画像データは座標情報(縦横)の2次元に、色情報を加えたもので、数値情報としては3次元になる。畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)は座標情報の2次元データを入力するモデルとなる。 2020.02.18 AI、データサイエンス
AI、データサイエンス ディープラーニングのテクニック その1 ディープラーニングは様々なテクニックの集合体と言える。ここでは以下の代表的なテクニックを記載する。勾配消失の問題の最大の原因はシグモイド関数の導関数の最大値が0.25と小さいことであった。よって、このシグモイド関数を別の物に置き換えることでこの問題が回避できるのでないか?というアプローチの元、シグモイド関数 2020.02.18 AI、データサイエンス
AI、データサイエンス ディープラーニング概要 前回までは、AIの歴史やディープラーニングのブレイクスルー前の話が主だった。今回からディープラーニングの話に突入。ディープラーニングの基本構造の由来はニューラルネットワーク。ニューラルネットワーク自体は隠れ層を持つことで非線形分類ができるようになったもの。単純パーセプトロンと比べると複雑なことができるとはいえる 2020.02.12 AI、データサイエンス
AI、データサイエンス 機械学習の評価手法 前回は、機械学習の各種手法について取り扱った。実際に学習するに当たって、以下の手法や考え方がある。学習データの扱い方評価指標機械学習にて手元のデータを学習することで、そのデータの分類、回帰ができるようになるが、重要なのは未知のデータに対しての予測能力である。しかし、機械学習にとっての未知は、人間にとっても 2020.02.11 AI、データサイエンス
AI、データサイエンス 機械学習の手法 機械学習の手法は大きく分けて以下となる。機械学習の手法そのもの機械学習の評価手法今回は「機械学習の手法そのもの」について記載する。学習種類は大きく分けて以下。教師あり学習教師なし学習強化学習教師あり学習とは以下と定義されている。与えられたデータ(入力)と元に、そのデータがどんなパターン(出力)になるの 2020.02.11 AI、データサイエンス
AI、データサイエンス 人工知能の問題点 その2 前回の続き。ただし、今回の問題点はディープラーニングにより解決されているものも含まれる。知識獲得のボトルネック特徴量設計の問題シンギュラリティ(技術的特異点)機械翻訳の歴史は以下となる。1970年代後半:ルールベース機械翻訳1990年代以降:統計的機械翻訳コンピュータが「意味」を理解しているため、 2020.02.09 AI、データサイエンス
AI、データサイエンス 人工知能の問題点 その1 人工知能の分野に様々な問題がある。これらを把握することで現状の限界を知り、現実世界への実現可能性を考察する必要がある。第1次AIブーム時のパズルや迷路、チェス、囲碁で一定の成果は上がられた。しかし、それは非常に限定された環境であり、現実世界の複雑な問題には適用できないという問題を指してトイ・プロブレム 2020.02.06 AI、データサイエンス
AI、データサイエンス 第3次AIブーム(機械学習・深層学習の時代) 機械学習、ディープラーニング(深層学習)の時代に突入。昨今のAIによる恩恵の時代。機械学習とは、プログラム自身が学習する仕組みであり、その学習はサンプルデータが多いほど良い。2000年以降はビッグデータと共に注目を浴びる。(ビッグデータで大量のサンプルを集められるので相乗効果に期待) 2020.02.04 AI、データサイエンス
AI、データサイエンス 第2次AIブーム(知識の時代)その2 オントロジー 第2次AIブーム初期に於いてエキスパートシステムによるアプローチが実現された。しかし、暗黙知の獲得、矛盾点調整の困難さからオントロジーの研究が注目を浴びる。意味ネットワークとは以下の概念構造である。概念をラベルが付いたノードで表現する。概念間の関係を矢印で結んだネットワークとする。 2020.02.03 AI、データサイエンス
AI、データサイエンス 第2次AIブーム(知識の時代)その1 エキスパートシステム 第2次AIブームが始まり知識をどう扱うかが重要な時代に突入。まずはエキスパートシステムというものが初期に登場する。人工無能という言葉が登場する。チャットボット、おしゃべりボットなどが例となる。実際に会話の内容を理解しているわけではないが、知性を感じてしまう錯覚を生む。 2020.02.02 AI、データサイエンス