本資料は2021年01月28日に社内共有資料として展開していたものをWEBページ向けにリニューアルした内容になります。
■目次
- データの種類と特徴
- DB室の案件/ソリューション
- 機械学習モデルの紹介
■データの種類と特徴
DB室で扱うデータの種類の代表例
- 時系列データ
- グラフ構造データ
- リレーショナルデータ
- CSV, Excel
DB室で扱うデータの特徴
- データのライフサイクル
■データの種類
【時系列データ】
- 時間と共に変化していくデータ
- 日々の売り上げデータ、毎日のツイート件数等
【グラフ構造データ】
- ノード(頂点)とエッジ(辺)の関係で結ばれたデータ
- 数学的にはエッジに重み(数値)がついているものをネットワークと呼ぶ
【リレーショナルデータ】
- 最も普及しているデータベースで格納されるデータ形式
- テーブル間の関係が記述、基幹システムだと数十~百以上のテーブル数になる
【CSV, Excel】
- 表形式のデータ全般
■データの特徴
【データのライフサイクル】
- データは増えたり減ったりすることがある。
あらかじめ考慮したAIモデルやアプリケーションが求められる。
【画像分類の場合】
【レコメンドの場合】
■DBチームの案件/ソリューション
データの種類からみた代表的な案件
【時系列データを利用した事例】
- 解決したいこと
Twitterを利用して公式アナウンスより早く電車が運行状況を知りたい - 解決方法
時系列解析(一定時間前の状態も考慮)を用いたノイズに強い運行状況
【グラフ構造データを利用した事例】
- 解決したいこと
顧客に対してパーソナライズされた商品のレコメンドをしたい。 - 解決方法
顧客の商品購買履歴及び商品閲覧履歴をグラフ構造解析。
顧客が購入した商品と類似度の高いアイテムをレコメンド。
【リレーショナルデータを利用した事例】
- 解決したいこと
社内に点在している顧客データを一元管理したい。
顧客同士のビジネスの橋渡しをしたい。 - 解決方法
日次で基幹システムからデータ連携及びデータ一元的に検索できるシステムを提供。
連携データ解析して必要と思われる情報をユーザーに通知。
【CSV, Excelデータを利用した事例】
- 解決したいこと
会社の情報と様々な条件を元に企業選定を行っているが人手の感覚を元に仕分けしているので自動化したい。 - 解決方法
過去の価格等のデータと選定結果を学習した機械学習モデルの構築。
会社情報と条件毎にスコアを算出しスコアの高い企業を自動選定。