スプレッドシート関数はもういらない、作業をあっという間に終わらせるためのデータプレパレーション

みなさん、日々どのくらい表計算ソフトを使っていますか?

この記事を読めば、表計算ソフトのスプレッドシート上で行っているデータの統合や、形式の統一、エラー修正などの作業をやめて、もっと劇的に時短しよう!という気になると思います。(少なくとも30日間は)


意外と多いデータ管理&分析以外のスプレッドシート作業

スプレッドシートを使うシーンといえば、営業部であれば、売上データの管理や売上見込みの試算、顧客データや活動履歴などの管理。マーケティング部門であれば、広告やキャンペーンの実施結果や顧客データ、マーケットデータ。カスタマーサポート部門であれば、顧客からのお問い合わせデータ、保証内容などがあります。

データ分析

業務に特化したSaaSやソフトウェアを導入していれば、表計算ソフトを触る時間は以前より減ったかもしれません。一方で、データを扱う部門では、社内データ量の増加に伴い、スプレッドシート上での作業が以前より急激に増えているのではないでしょうか?

これらの作業は数値計算やデータ一覧の作成作業だけではありません。実際は、これらの分析作業の前にバラバラなデータの統合や修正、クリーニングといった加工作業を行っているはずです。当たり前のように毎回発生するので、もはや無意識に行っている作業かもしれません。

このように、知らず知らずのうちに時間を奪っている一連の作業を「データプレパレーション」と呼びます。(その他のデータに関する用語はこちらからご確認できます)

 

こんな作業はデータプレパレーションです

 

  • 顧客データで株式会社と(株)、()や英数字の半角全角、ローマ字表記かカタカナ表記など、表記ゆれの修正
  • フォーマットが異なるデータを名前やEメールアドレスで紐づけし、一つのデータに統合
  • 請求書や経費精算書など、別フォーマットのファイルから別ファイルへ手入力、またはコピペして入力

 

数が少ないうちは慣れれば早い作業ですが、これが数百、数千、そして数万と増えたときに、複雑なスプレッドシート関数の入力は骨の折れる作業になります。

あなたはデータプレパレーションに、どれだけの時間をかけていますか?

データアナリストやデータサイエンティストですら、データプレパレーションに分析業務時間の50~80%の時間を費やしていると言われていますから、専門家でない場合はさらに多くの時間がかかっているのではないでしょうか。

ミスやエラーがあったり、正しいデータが摘出されていなかったり、データ分析前のデータ収集やプレパレーションの過程における少しのズレが、判断ミスや然るべき改善策をとれないなどの結果に繋がってしまいます。そのため、データプレパレーションはデータ分析において最も重要なパートであり、ミスが許されないからこそ慎重になって当然の作業ともいえます。

 

作業時間の短縮も、ヒューマンエラーの防止も叶えるデータプレパレーションツール

データの処理に特化したツールがデータプレパレーションツールです。スプレッドシート関数やマクロの知識がなくても簡単にデータ分析用のデータを作成でき、セルフサービス型データプレパレーションツールであれば、IT部門を通さずにいつでも自由にデータにアクセスして利用できます。

スプレッドシートで数万列もある膨大なデータ量であっても、ツールを使えばあっという間に、そして間違いなくデータプレパレーションが完了します。

 

データプレパレーション

Altair Monarchを使ったデータプレパレーション

Altair Monarch(アルテア モナーク)はセルフサービス型データプレパレーションツールです。

構造化データ(データベースで扱えるような定義&整理されたデータ)のみならず、非構造化データ(スプレッドシートで作成した請求書など)、クラウドベースのデータ、ビッグデータを含む複数のデータソースに接続でき、マウス操作で簡単に分析用の“使える”データセットに変換できる優れものです。

以下で、Monarchを使用してフォーマットの異なるファイルをひとつのデータにまとめ、クレンジングする手順を簡単にご説明します。

ここでは、すでにある顧客情報に対して、新たに入手したイベントのアンケートデータを紐づける作業を例にとります。

 

データプレパレーションプロセス

 

登録者データ、アンケートデータ、既存の顧客情報はそれぞれのフォーマットが異なり、規則性のない順序なので、データの結合は意外と面倒で時間もかかる作業です。単純なコピペやデータ検索に膨大な時間が消費されてしまいます。

 

以下は表計算ソフトを使わず、Monarchを使用したやり方です。

 

①PDFファイルをMonarchに読込

データ読み込み

データプレパレーションツール


②データクレンジング

会社名は表記ゆれが多く発生する項目です。ローマ字表記かカタカナ表記か、「株式会社」など法人格の表記有無と方法、スペースの有無等、目視や検索だけでは拾い出せない可能性があります。Monarchでは、表記ゆれの修正もスプレッドシート関数を使わず簡単に行えます。

データクレンジング

その他のデータクレンジングもMonarchの各種機能で行います。

 

③データの結合

データクレンジングが完了すれば後は結合するだけです。

データ統合

 

VLOOKUPを使わず、マウス操作だけで、簡単にフォーマットの異なるデータ同士を結合できました。

データ統合

一度データ取得条件を定義すれば、作業の自動化ができます。同じフォーマットのファイルの処理が定期的に発生している場合、より作業効率化、時短を実現できます。

 

データプレパレーションツールを活用してデータ活用をもっと簡単に

データプレパレーションツールを使用すれば、これまで時間をかけていたスプレッドシートでの作業を大幅に削減できます。本来時間をかけるべきデータ分析などの業務に集中でき、最適な意思決定を行えるようになるほか、残業などの人件費の削減にもなり、ビジネスを成功へ導く一助となるはずです。

Altair Monarchは現在30日間の試用版を現在無償で提供しております。この機会にぜひお試しください。

データプレパレーションツール

関連記事:
データ分析に欠かせない「データプレパレーション(データ準備)」の効率的な進め方とは?
セルフサービス型データ準備ツールで強化する、社内のデータガバナンス

5 2 votes
Article Rating

カテゴリー: データアナリティクス

Subscribe
Notify of
0 Comments
Inline Feedbacks
View all comments