久しぶりのポストです。Coursera で面白そうなコースがあったので受講して見てます。
DeepLearning.AI の提供する、 AI for Everyone って講座です。防備のためのメモですが、これから受講してみたい人の参考になれば。
日本のAI研究第一人者である松尾豊教授が監修していて、AI検定のG検定やE検定の下地となる知識を得ることができます。
はじめに
DX (Digital Transformation)、と一口に言ってもさまざまな定義があり、日本では2018年に経済産業省に改めて定義している。元々は、2004年にスウェーデンの Professor Eric Stolterman による定義がDXの先駆けとされる。
IT penetration changes people’s lives in a better direction in all aspects.
Professor Eric Stolterman
DX は、日本では 「デジタル化」のように短絡的に表現されるが、Digitization と Digitalization に分けることができる。
- Digitization:アナログ情報のデジタル情報への変換
- Digitalization:デジタル化された情報の利活用による付加価値の創造
AI や DL (Deep Learning) は、DX においてかなり重要な要素となりつつある。これは、AI/DL を活用することで、扱えるデータやプロセスが大幅に増えたからである。例えば、画像生成や自然言語処理、顔認証やデータに基づく予測や検知など。
AI とは
AI の分類:
- ANI (Artificial Narrow Intelligence):特化型人工知能、いわゆる2023年ごろから急速に発達しているAIで自動運転やチャットなど特定領域で高い性能を示す
- AGI (Artificial General Intelligence):汎用人工知能、こちらがSFとかによく出てくる 「人間のような知性」を持ったAI
最も一般的に使われている機械学習は、入力から出力へのマッピングであり、これは教師あり学習とも呼ばれる。例えば、製造業において、画像データを入力としてその良否を出力するような AI や、英語を入力として中国語を出力するような AI がこれにあたる。
近年、教師あり学習が急速に発達し出したのは、データ及びニューラルネットワーク構築の両側面から大規模化が進んだためである。教師あり学習は、データが多ければ多いほど、ニューラルネットワークが大規模であればあるほど性能が良くなる傾向にある。
機械学習:「明示的なプログラムなしに学習する能力をコンピュータに与える研究領域」と、アメリカのコンピュータサイエンティストであるアーサー・サミュエルが定義した。
Machine learning (ML) defined is “the field of study that gives computers the ability to learn without being explicitly programmed.”
1959, Arthur Samuel
データサイエンス:データから知識や洞察を抽出する研究領域のこと。機械学習に対して、こちらは人が行うようなニュアンスがあり、多くはスライドデッキやマネジメント層の意思決定として出力される。
2024年現在では、ディープラーニングとニューラルネットワークはほとんど同じ意味で使われることが多い。過去には同様の概念はニューラルネットワークと呼ばれていたが、現在ではディープラーニングと呼ばれることが多くなりつつある。
AI (Artificial Intelligence) の部分集合に、ML (Machine Learning) があり、さらにその部分集合に DL/NN (Deep Learning/Neural Network) がある。
なお、DS (Data Science) は人によって捉え方が違うため注意が必要。概ね以下のとらわれ方をする:
- DS は 科学的なデータ分析一般であり、AI における ML や DD/NN を横断するような幅広い概念
- DS は AI の部分集合
- AI は DS の部分集合
ニューラルネットワークはもともと脳科学に触発されたものだが、その仕組み自体は意外に生物学的な脳の仕組みとはほとんど関係がない。 あくまでも脳科学からインスピレーションを得ただけ。
現時点では、複雑なタスクに対する AI の能力はそこまで高いとは言えない。ここで、複雑なタスクとは、概ね人間が1秒以内に達成することのできないタスク。
例えば、現在の市場について分析を行いそれを100ページ程度のレポートにまとめることは、現在の処理能力では不可能。逆に、はっきりとした画像からそこに写っているものが何か?をラベリングするような(ある意味)簡単な処理では、速度・精度ともに人間を超えている。
また、AI が学習するためには、メールであれば少なくとも数千件程度のデータ量が必要であり。千件からそれ以下のデータ量では十分な学習が行えず、基本的には有用な出力が得られない。
機械学習は基本的に、以下の状況で機能する:
- 大量の利用可能なデータが存在する
- 比較的単純な概念を学習して出力する
逆に、機械学習は以下の状況で機能しにくい:
- 少量のデータで複雑な概念を学習する必要がある
- 少量のデータを一般化し、新しいタイプのデータに対応する必要がある
例えば、カメラに映る自動車を判別することは比較的得意ではあるが、カメラに映る人物のジェスチャーからその人の意図を理解することは苦手。
また、大量の症例がある病気をX線画像から診断することは得意だが、少数の画像からなる医学書の症例分析を解釈して診断を行うことは苦手とする。
ML (Machine Learning)とは、大量の入力データ及び出力データを用意して、それらを AI のモデルに学習させることで、ニューロンの組み合わせ方(ニューラルネットワークの構築)を自動で行わせる技術のこと。
ニューロンは、単純な入出力のマッピングとして機能する単一の要素。
例えば画像データでは、画素数のすべてに対応したニューロンがあり、それらが一次的な学習をし、さらに次の層が二次的な学習をし… といったフローが続くことで、画像の対象物を判定できる。このプロセスでは、例えば エッジ -> パーツ -> 大まかな形状 といった具合に段階的に学習する。
ここで重要なのは、大量の入力データと出力データを用意するだけで、内部の学習過程について一切考える必要がない点が機械学習の利点。
AI プロジェクト
機械学習プロジェクトのワークフローは、以下となる。
- データの収集
- モデルの訓練
- モデルの展開
特にモデルの訓練では、モデルの精度が高くなるまで何度も同じ作業を反復することが一般的。
対して、データサイエンスプロジェクトのワークフローは、以下となる。
- データの収集
- データの分析
- 仮説及び行動の提案
データサイエンスにおいては、機械学習と違い学習モデルを構築するのではなく、データから洞察を得てナレッジや行動をアウトプットすることが目的。
現代社会のデータの利用のされ方:
セールス:
データサイエンス:セールスファネルの最適化。
機械学習:営業ターゲットのデータセットの自動ソート/フィルタリング
製造:
データサイエンス:製造ラインの最適化
機械学習:自動視覚検査などに
HR:
データサイエンス:採用ファネルの最適化
機械学習:書類選考の自動化
マーケティング:
データサイエンス:A/Bテスト
機械学習:個別のユーザに合わせたレコメンデーション
農業:
データサイエンス:農作物の育成環境等の分析
機械学習:正確な自動除草作業
Due diligence:デューデリジェンス、物事の適正さを評価することで、よく金融業界で投資のリスク及びリターンを評価する際に使われる。適正評価ともいう。意訳すると、正しいと思うことが本当に正しいものであるかを時間をかけて検証すること。
AIプロジェクトの選定では、大きく3つの側面からデューデリジェンスを行う必要がある。
- AI に実行できるタスクであること(技術的適正評価)
- ビジネスにとって価値があること(実務的適正評価)
- 人類や社会にとって利益をもたらすこと(倫理的適正評価)
さらに、その AI プロジェクトを内製するのか外注するのかの判断も必要。判断基準は大きく分けて以下:
- かなりユニークかつ特化したようなもので、独自の強みを持つものは内製の方が優位
- 業界標準なものやすでに広く利用されているものは外注の方が望ましい
AI チームと連携するには、プロジェクトの「許容基準」を特定することが有効。許容基準を指定するときは統計的に行う必要がある。
機械学習アルゴリズムは、Training data: 訓練データ によって学習を行い、入力と出力のマッピングを決定する。このマッピングの精度を Test data: テストデータ によって評価する。もう少し技術的に発展した評価として、Validation data: 検証データ を使用することもある。
AI の導入と活用
応用的な AI の活用事例には、AI スピーカーなどがある。AI スピーカーの内部プロセスは以下:
- トリガーワード検出 (OK, Google とか)
- 音声認識 (テキストデータへの変換)
- 意図認識 (テキストデータから意味を)
- コマンドの実行
この一連の流れを AI パイプラインともいう。
複雑な AI ソリューションは、複数の AI コンポーネントの組み合わせとも言える。
自動運転プロセスも AI スピーカーのようにパイプラインを構築することで実現する:
- 画像やレーダー、LIDARによる自動車や歩行者の検出
- 検出結果に基づく、軌道予測の計算
- 経路計画の計算
- ハンドル、ブレーキ、アクセルなどの操作
LIDAR:Light Detection And Ranging または Laser Imaging Detection And Ranging、光検出と測距。自動車や航空機などの輸送機器から、地質学や航空宇宙工学などの学問にも広く利用される。
AI 関連のビジネスは過渡期にあるため、明確な役割は定まっていないが、概ね以下のようなメンバーがチームを構成する:
- ソフトウェアエンジニア:AI ワークフロー内で実行されるコマンドをデザインする
- 機械学習エンジニア:入力から出力へのマッピング(機械学習モデル)をデザインする
- 機械学習研究者:最先端の機械学習技術をさらに拡張する
- データサイエンティスト:データにから洞察を掬い上げる
- データエンジニア:データを整理し、保守・運用していく
AI トランスフォーメーションプレイブック:
- パイロットプロジェクト実施:半年〜1年以内に目にみえる成果を得られるような目標を選択すると良い。組織内全体で AI プロジェクトへの勢いがつく。
- インハウスチーム組成:AI プロジェクトメンバーは、組織を横断する人選が望ましい。その他のプロジェクト管理と同様のことが言える。CEO や CIO の監視下に置くと良い。
- トレーニング実施:経営幹部、AI プロジェクトに携わる部門リーダー、AI エンジニアがそれぞれのレイヤで学習することが必要。
- AI 戦略策定:AI を活用して優位性を生み出し、選んだ戦略からより多くのデータセットを得るように戦略を策定すると良い。
- 社内外へのコミュニケーション:AI に対して合理的ではない人もいるので、不安を取り除くようなコミュニケーションも必要。
AI 導入時の注意点(すべきではないこと):
- AI が課題を全て解決するものと期待しないこと
- 機械学習エンジニアだけに AI の導入を頼りきらないこと
- AI プロジェクトが最初から機能するものと決めつけないこと
- 従来の企画工程がそのままできると思い込まないこと
- 最高のエンジニアがいなければ成果が出せないと思い込まないこと
AI の応用分野について:
- コンピュータビジョン:
画像分類/物体認識、物体検出、画像セグメンテーション、物体追跡など - NLP (Natural Language Processing:自然言語処理):
テキスト分類 (感情認識など)、情報検索、固有表現抽出、機械翻訳、構文解析、品詞タグ付けなど - 音声処理:
音声認識 (Speech-to-text)、トリガーワード検出、音声合成 (Text-to-speech, TTS) など
ロボット工学:
認知、経路計画、制御などに利用される
画像、音声や自然言語などの非構造化データは、人間にとってわかりやすく共感しやすいため、マスコミに取り上げられやすい傾向にある。実際には、データベースなどの構造化データも非構造化データと同じぐらい目覚ましい進歩を遂げている。
その他の AI の応用分野:
- 教師なし学習:
特定の出力ラベルなしに、データに関する特徴などを自動で見つけることができる。例えば、Youtube の動画から猫を検出する、など - 転移学習:
あるタスクのための学習データを利用して、別のタスクを学習させる。例えば、自動車の画像検出をゴルフカートの画像検出に転用する - 強化学習:
報酬信号を利用することで、報酬を最大化させるような方法を AI が自動で学習していく。例えば、ヘリコプターの GPS、加速度計、コンパスなどの計器データを最適化する学習など - GANs (Generative Adversarial Networks)、敵対的生成ネットワーク:
新しい画像をゼロから生成するなど - 知識グラフ:
重要な情報をリストできるようなデータベース。「役に立つと思われるもの」を自動で学習する。
AI と社会
AI は現代社会に非常に大きな影響を与えつつあるが、AI に対する現実的な見識を持ち、楽観的または悲観的になりすぎないことが重要。現段階では、AI にも多くの限界があることを理解すること。
例えば、AI は、その構成が複雑になればなるほど説明可能性の担保が難しくなる。非常にうまく調整された AI は、その複雑さゆえに、なぜその出力となったのか?に答えることができない。説明可能性を補強するために専用のツールが必要になる場合もある。医療領域では、なぜ AI が画像からある診断を下したのかの確信を得るためにヒートマップを用いて、AI がどこに着目しているのかをビジュアルで確認する、などの処理を行うこともある。
AI は、利用方法によっては時に差別やバイアスを生み出してしまうことがある。例えば、インターネット上のテキストから学習された統計データに対する AI の処理:
- 男性:女性に対して、父親:母親は、ニュートラル
- 男性:女性に対して、王:女王は、ニュートラル
- 男性:プログラマに対して、女性:家事従事者は、バイアスがかかっている
ある種の AI では、自然言語の単語は数字で表現される。極端に簡単にした例では、(1, 1)のような形式。本来は数千個の数字などより複雑な表現となる。
ここで、例えば男性が(1, 1)として表現され、かつ、プログラマが(3, 2)と表現されるのであれば、男性からプログラマまでの距離は、 (2, 1) となる、そして、女性が仮に(2, 3)と表現されるのであれば、差分の距離を足して、(2+2, 3+1) = (4, 4)のようになる。ここで、現代のインターネット上のテキストに関するデータセットでは、家事従事者が(4, 4)に対応する。(悲しいことに)
具体的なバイアスの例:
- 女性に対して差別的な評価をする採用向けの AI
- 明るい肌の色の人の方が有利に動作する顔認証システム
- 特定の出自の人に対して不利に働くローン承認システム
- 先入観を強化してしまうような検索システム
バイアスへの対応策:
- 技術的な解決策:バイアスに対応するデータの重みを軽くする。入力データ自体をインクルーシブにする。
- システムの透明性の担保:監査プロセスなど
- AI を構築する人々自体の多様性を確保する
コンピューターセキュリティにおいて、セキュリティで保護されたシステムに対する攻撃とは、意図したこと以外のことを実行させようとすること。同様に、AIシステムに対する敵対的攻撃は、意図していないものを実行させようとする試みのこと。
例えば、ウサギの画像に小さな摂動を与えることによって、AI にこの画像を机であると判断させてしまうことができる。あくまでも AI が検知する程度の摂動なのであって、人間の目ではウサギの画像のま まとして見える。
Perturbation:摂動、一般に力学系において、主要な力の寄与(主要項)による運動が、他の副次的な力の寄与(摂動項)によって乱される現象
または、現実世界に変化を加えることで、AI システムに攻撃を加えることもできる。一時停止の標識にある種のステッカーを貼り付けることによって、自動運転システムが標識を標識として認識しなくなる、など。
AI への攻撃を防御するには、それなりのコストがかかることが多い。また、スパム対アンチスパムのように、常に反対の勢力によってせめぎ合っているような事例も存在する。
AI の誤った活用例:
- ディープフェイク
- 民主主義とプライバシーの毀損
- 偽のコメントの生成
- スパムや詐欺への利用
AI が2030年までに全世界の仕事に与える影響(参考、McKinsey Global Institute):
- 4億から8億人の人々の仕事が失われる
- 5.55億から8.9億人の人々の仕事が新しく創出される
将来の多くの仕事は、今現在では恐らく名前すらない。ドローンのトラフィック最適化や、DNAベースの薬のデザイナー、3Dプリント衣服デザイナーなど。
これからの AI の発達による変化に備えるには:
- 条件付きベーシックインカム:セーフティネットと学習の奨励を提供
- 生涯学習
- 政治的な解決策
今持っている経験や知識を捨てて、ゼロから AI を学ぶのではなく、自分のバックグラウンドの上に AI スキルを身につけることで、他者には真似できない競争力を得ることができる。
JDLA: Japan Deep Learning Association について
JDLAは、ディープラーニングを事業の核とする企業が中心となりディープラーニング技術を日本の産業競争力につなげていこうという意図のもと2017年に設立。
人材育成については、大きく3つの活動を行う:
- AI for Everyone:
全てのビジネスパーソンに向けたエントリー講座。上にまとめた内容 - G検定:
プロジェクトの企画や推進をするスタッフ向けの検定。企画職、マネージャや経営層向け - E検定:
アルゴリズムの実装やソリューション開発を具体的に行うスタッフ向けの検定。エンジニア向け
JDLA の主催する検定には、AI for Everyone の受講票を提示することで、割引が受けられる制度がある。
まとめ
あまり細かく技術的な内容に触れずに、AI とはどのようなもので、何ができて何ができないのか?を理解するには良い講座と思います。
とりあえず、G検定あたりから受けてみたいですね。
それでは
コメント