機械学習ライブラリ（初級編）

　このページは『AI開発準備』の最後のページ「機械学習ライブラリ」の初級編です。AIモデルの学習に大量のデータを使用しますが、データセットとして簡単にかつ効率よくデータをまとめて扱います。その仕組みを実装しているのがフレームワークと呼ばれます。E資格認定試験のコード問題の出題もフレームワーク（PytorchまたはTensorFlow）がベースです（以前はスクラッチコードの時もあり）。ここにはデータセットを処理するpandas、sklearnとフレームワークのPytorchを載せています。それぞれに『チェック』としてキーワードを挙げましたので、知らないキーワードがあれば、各セクションにあるリンクから詳細を確認してください。また、画像データの特徴についても記載します。画像認識技術の発展によりディープラーニングが注目されるようになりました。

AI開発準備

ローカル環境

ライブラリ入門

ライブラリ初級

『AI開発準備』に戻る＞＞

道具として利用するイメージをつかみます

目次

1. データセット
- 1.1. Pandas
- 1.2. sklearn
2. フレームワーク
- 2.1. Pytorch、TensorFlow（Keras）
3. 画像データ
- 3.1. AIで処理する画像データ
- 3.2. データセットの入手方法

データセット

Pandas

データを表形式に扱います。
CSVファイルから読み込みも可能です。

チェック

Series、DataFrame
loc、iloc、index
read_csv、to_csv

次項のsklearn下のリンクに使用例を記載しました。KaggleにあるTitanic（タイタニック）データをpandasでデータ加工しています。

目次へ＞＞　ページの先頭へ＞＞

sklearn

データをデータセットとして扱います。
サンプルデータセットを入手できます。

チェック

Datasets
KFold

　学習データを分割する方法です。pandasも利用しています。

StratifiedKFold（sklearn）サンプルコードでイメージを掴む

StratifiedKFold（sklearn）サンプルコードでイメージを掴む

　人工知能（AI）開発で使用するデータを扱うライブラリとして「sklearn」をよく見かけます。ここでは、k-分割交差検証（データセットを学習に適した形に分割）で利用する「StratifiedKFold」のサンプルコード […]

sell pandas / sklearn

「sklearn」ではデータセットを簡単に入手できる機能があります。手書き数字データセット（MNIST）sklearnでの利用手順を『AI学習用データセットのいろいろな入手方法』に記載しています。

目次へ＞＞　ページの先頭へ＞＞

フレームワーク

Pytorch、TensorFlow（Keras）

深層学習ライブラリやフレームワークと呼ばれます。ライブラリと同じようにimportして使います。

チェック（Pytorch）

Tensor
DataLoader
Datasets
Transform
自動微分

　Pytorchを紹介します。

Pytorchの利用例（DCGANサンプルコード）

Pytorchの利用例（DCGANサンプルコード）

　人工知能（AI）を効率よく開発するため、フレームワークが利用されます。E資格では複数のフレームワークから選択できますが、ここではPytorchを例にします。フレームワークが強力なツールであることがより実感できるよう、P […]

sell CNN / DCGAN / PIL / Pillow / Pytorch / テンソル / 畳み込み

目次へ＞＞　ページの先頭へ＞＞

画像データ

AIで処理する画像データ

画像データを読み込むと3次元テンソルになります。1～3それぞれの次元に意味があります。

特徴

24ビット（256色）
10進数表記、16進数表記
RGB、BGR

　画像データを詳しく見て、理解を深めます。

AIで扱う画像データについて

　画像処理を行う人工知能（AI）モデルを開発する場合、画像データに関する知識がないと何をやっているのか理解できません。Pythonでの取り扱いやコンピューター自体で画像がどのように扱われているかを説明します。理解を深める […]

sell COLOR_BGR2RGB / CV2 / Matplotlib / OpenCV / 次元

目次へ＞＞　ページの先頭へ＞＞

データセットの入手方法

AI学習にはデータセットが必要です。Pythonでの取り扱い方法も交えながら、MNISTデータの入手方法を紹介します。

　上記「sklearn」にて手書き数字（MNIST）の利用方法について触れました。MNISTの利用方法はデータをダウンロードするなど他にも方法があります。Pythonコードの復習もできるサンプルコードを記載しました。

AI学習用データセットのいろいろな入手方法

AI学習用データセットのいろいろな入手方法

　人工知能（AI）による画像分類タスクのチュートリアルでよく利用される、MNISTデータセット（手書き数字）を例にします。データセットはAIが処理しやすいように前処理（サイズを揃えるなど）がされていて、何を表す画像なのか […]

sell Matplotlib / MNIST / pickle / sklearn

目次へ＞＞　ページの先頭へ＞＞

『AI開発準備』に戻る＞＞

E資格受験レポ 11コンテンツへの入り口

E資格の情報収集

E資格本番試験対策

サイトマップ

以上

Posted by futa