メインコンテンツまでスキップ

データインポート

データ分析を始める前に、分析対象のデータをインポートする必要があります。 3つの方法からお選びいただけます。

インポート方法

方法①: CSV/Pickleファイルのアップロード

  1. csv/pklアイコンをクリックします。

    CSVアップロードボタン

  2. アップロードしたいCSVファイルを選択します。

    ファイル選択ダイアログ

    ファイル形式について

    .xlsx/.xls形式のファイルは直接アップロードできません。

    事前にCSV形式への変換が必要です:

    変換方法(Excel)

    1. Excelでファイルを開く
    2. 「ファイル」→「名前を付けて保存」を選択
    3. ファイルの種類で「CSV (カンマ区切り) (*.csv)」を選択
    4. 保存をクリック
  3. ファイルが正常に読み込まれると、データプレビューが表示されます。

    CSVデータプレビュー

    注意

    ファイルサイズが大きいと、表示に時間がかかることがあります。

    備考
    • 1行目が列名として認識されます。前処理機能で後からヘッダーの変更が可能です。
    • ファイルを再びアップロードすると、テーブルが上書きされます。

方法②: データのコピー&ペースト

  1. pasteアイコンをクリックします。

    pasteアイコン

  2. Excel等のテーブルからアップロードしたいデータ範囲をコピーします。

    データコピー

  3. テキストエリアにデータを貼り付け、読込をクリックします。

    データ貼り付け

    コピー&ペーストのコツ
    • ヘッダー行も含めてコピーしてください
  4. ファイルが正常に読み込まれると、データプレビューが表示されます。

    pasteデータプレビュー

方法③: サンプルデータの読み込み

A-Genieの機能を試したいときや、データ分析のデモにご利用ください。

  1. sampleアイコンをクリックします。

    サンプルデータアイコン

  2. サンプルデータを選択し、読込をクリックします。

    サンプルデータの選択

    利用可能なサンプルデータ

    以下のサンプルデータがご利用可能です:

    • 医薬品の有効成分: 医薬品の原料組成と有効成分量デモデータ(393件)
    • ペンギン: ペンギンの種別、体のサイズ、生息地データ(344件)
    • 高機能フィルム: フィルムの製造条件と品質物性デモデータ(457件)
    • ワイン: ワインの成分と品質評価データ(178件)
    • タイタニック: タイタニック号の乗客データ(1,309件)
    • カリフォルニアの住宅価格: カリフォルニア州の住宅価格と地域特性データ(20,640件)
    • 管理図: 製品の品質測定データ(240件)
    • ゲージR&R測定: 測定者別の品質データ(6件)
  3. ファイルが正常に読み込まれると、データプレビューが表示されます。

    サンプルデータプレビュー

インポートされたデータの確認

  1. テーブル下部の情報アイコン(ⓘ)をクリックします。

    データ情報アイコン

  2. データ数や平均値等の各列の統計情報が確認できます。

    統計情報の表示

確認できる統計情報

項目意味
countデータ数
nan_count欠損値の数
mean平均値
max最大値
75%75%パーセンタイル点(第3四分位数)
50%50%パーセンタイル点(中央値)
25%25%パーセンタイル点(第1四分位数)
min最小値
std標準偏差
IQR_outliers四分位範囲
3σ_outliers3σの範囲
Hampel_outliersHampel identifierの範囲
top3_categoriesデータ数が多い上位3カテゴリ
unique値の種類