2020-02

AI、データサイエンス

ディープラーニングのテクニック その1

ディープラーニングは様々なテクニックの集合体と言える。 ここでは以下の代表的なテクニックを記載する。 勾配消失の問題の最大の原因はシグモイド関数の導関数の最大値が0.25と小さいことであった。 よって、このシグモイド関数を別の物に置き換えることでこの問題が回避できるのでないか? というアプローチの元、シグモイド関数
AI、データサイエンス

ディープラーニング概要

前回までは、AIの歴史やディープラーニングのブレイクスルー前の話が主だった。 今回からディープラーニングの話に突入。 ディープラーニングの基本構造の由来はニューラルネットワーク。 ニューラルネットワーク自体は隠れ層を持つことで非線形分類ができるようになったもの。 単純パーセプトロンと比べると複雑なことができるとはいえる
AI、データサイエンス

機械学習の評価手法

前回は、機械学習の各種手法について取り扱った。 実際に学習するに当たって、以下の手法や考え方がある。 学習データの扱い方 評価指標 機械学習にて手元のデータを学習することで、そのデータの分類、回帰ができるようになるが、重要なのは未知のデータに対しての予測能力である。 しかし、機械学習にとっての未知は、人間にとっても
AI、データサイエンス

機械学習の手法

機械学習の手法は大きく分けて以下となる。 機械学習の手法そのもの 機械学習の評価手法 今回は「機械学習の手法そのもの」について記載する。 学習種類は大きく分けて以下。 教師あり学習 教師なし学習 強化学習 教師あり学習とは以下と定義されている。 与えられたデータ(入力)と元に、そのデータがどんなパターン(出力)になるの
AI、データサイエンス

人工知能の問題点 その2

前回の続き。 ただし、今回の問題点はディープラーニングにより解決されているものも含まれる。 知識獲得のボトルネック 特徴量設計の問題 シンギュラリティ(技術的特異点) 機械翻訳の歴史は以下となる。 1970年代後半:ルールベース機械翻訳 1990年代以降:統計的機械翻訳 コンピュータが「意味」を理解しているため、
AI、データサイエンス

人工知能の問題点 その1

人工知能の分野に様々な問題がある。 これらを把握することで現状の限界を知り、現実世界への実現可能性を考察する必要がある。 第1次AIブーム時のパズルや迷路、チェス、囲碁で一定の成果は上がられた。 しかし、それは非常に限定された環境であり、現実世界の複雑な問題には適用できないという問題を指してトイ・プロブレム
AI、データサイエンス

第3次AIブーム(機械学習・深層学習の時代)

機械学習、ディープラーニング(深層学習)の時代に突入。 昨今のAIによる恩恵の時代。 機械学習とは、プログラム自身が学習する仕組みであり、 その学習はサンプルデータが多いほど良い。 2000年以降はビッグデータと共に注目を浴びる。 (ビッグデータで大量のサンプルを集められるので相乗効果に期待)
AI、データサイエンス

第2次AIブーム(知識の時代)その2 オントロジー

第2次AIブーム初期に於いてエキスパートシステムによるアプローチが実現された。 しかし、暗黙知の獲得、矛盾点調整の困難さからオントロジーの研究が注目を浴びる。 意味ネットワークとは以下の概念構造である。 概念をラベルが付いたノードで表現する。 概念間の関係を矢印で結んだネットワークとする。
AI、データサイエンス

第2次AIブーム(知識の時代)その1 エキスパートシステム

第2次AIブームが始まり知識をどう扱うかが重要な時代に突入。 まずはエキスパートシステムというものが初期に登場する。 人工無能という言葉が登場する。 チャットボット、おしゃべりボットなどが例となる。 実際に会話の内容を理解しているわけではないが、知性を感じてしまう錯覚を生む。
AI、データサイエンス

第1次AIブーム(推論・探索の時代) その3 モンテカルロ法

前回のボードゲームの続きに位置付けられる話。 ボードゲームに勝利する際は探索木とそのルート上の点数が重要になってくるが、この点数付けは人間が実施している。 よって、点数を付けた人次第で結果が左右される状態とも言える。 それを解消するためにモンテカルロ法という手法を用い始めた。