データインポート
データ分析を始める前に、分析対象のデータをインポートする必要があります。 3つの方法からお選びいただけます。
インポート方法
方法①: CSV/Pickleファイルのアップロード
-
csv/pklアイコンをクリックします。

-
アップロードしたいCSVファイルを選択します。
ファイル形式について.xlsx/.xls形式のファイルは直接アップロードできません。
事前にCSV形式への変換が必要です:
変換方法(Excel)
- Excelでファイルを開く
- 「ファイル」→「名前を付けて保存」を選択
- ファイルの種類で「CSV (カンマ区切り) (*.csv)」を選択
- 保存をクリック
-
ファイルが正常に読み込まれると、データプレビューが表示されます。
注意ファイルサイズが大きいと、表示に時間がかかることがあります。
備考- 1行目が列名として認識されます。前処理機能で後からヘッダーの変更が可能です。
- ファイルを再びアップロードすると、テーブルが上書きされます。
方法②: データのコピー&ペースト
-
pasteアイコンをクリックします。

-
Excel等のテーブルからアップロードしたいデータ範囲をコピーします。

-
テキストエリアにデータを貼り付け、読込をクリックします。
コピー&ペーストのコツ- ヘッダー行も含めてコピーしてください
-
ファイルが正常に読み込まれると、データプレビューが表示されます。

方法③: サンプルデータの読み込み
A-Genieの機能を試したいときや、データ分析のデモにご利用ください。
-
sampleアイコンをクリックします。

-
サンプルデータを選択し、読込をクリックします。
利用可能なサンプルデータ以下のサンプルデータがご利用可能です:
- 医薬品の有効成分: 医薬品の原料組成と有効成分量デモデータ(393件)
- ペンギン: ペンギンの種別、体のサイズ、生息地データ(344件)
- 高機能フィルム: フィルムの製造条件と品質物性デモデータ(457件)
- ワイン: ワインの成分と品質評価データ(178件)
- タイタニック: タイタニック号の乗客データ(1,309件)
- カリフォルニアの住宅価格: カリフォルニア州の住宅価格と地域特性データ(20,640件)
- 管理図: 製品の品質測定データ(240件)
- ゲージR&R測定: 測定者別の品質データ(6件)
-
ファイルが正常に読み込まれると、データプレビューが表示されます。

インポートされたデータの確認
-
テーブル下部の情報アイコン(ⓘ)をクリックします。

-
データ数や平均値等の各列の統計情報が確認できます。

確認できる統計情報
| 項目 | 意味 |
|---|---|
| count | データ数 |
| nan_count | 欠損値の数 |
| mean | 平均値 |
| max | 最大値 |
| 75% | 75%パーセンタイル点(第3四分位数) |
| 50% | 50%パーセンタイル点(中央値) |
| 25% | 25%パーセンタイル点(第1四分位数) |
| min | 最小値 |
| std | 標準偏差 |
| IQR_outliers | 四分位範囲 |
| 3σ_outliers | 3σの範囲 |
| Hampel_outliers | Hampel identifierの範囲 |
| top3_categories | データ数が多い上位3カテゴリ |
| unique | 値の種類 |