LAC WATCH

セキュリティとITの最新情報

RSS

株式会社ラック

メールマガジン

サイバーセキュリティや
ラックに関する情報をお届けします。

サービス・製品 | 

デジタルトランスフォーメーション(DX)に不可欠な「非構造化データ」の活用

IPAが発行した「DX白書2023」によると、2022年度の調査時点で日本企業におけるDXの取り組み状況は69.3%と、2021年度時点の55.8%から増加しており、日本企業全体でDX推進への関心が引き続き高まっていると言えます。ただ、「全社戦略に基づいて全社的にDXに取り組んでいる」企業はまだ26.9%にとどまっています。

DX白書2023 | 書籍・刊行物 | IPA 独立行政法人 情報処理推進機構

経済産業省が2022年7月に発行した「DXレポート2.2」では、個々の企業だけでなく、産業全体として変革する必要性が指摘されています。つまり、DX推進は単に部署や事業のレベルで考えるだけでなく、経営層が主導し、全社的な取り組みとして産業全体の変革(デジタル産業への変革)を見据える必要があるということです。

経済産業省によるDXの定義は、「企業がビジネス環境の激しい変化に対応し、データとデジタル技術を活用して、顧客や社会のニーズを基に、製品やサービス、ビジネスモデルを変革するとともに、業務そのものや、組織、プロセス、企業文化・風土を変革し、競争上の優位性を確立すること」とされています。

経済産業省 / DXレポート2.2(概要)

デジタルガバナンス・コード (METI/経済産業省)

DX推進に際しては様々な課題がありますが、経済産業省の定義にもあるとおり「データとデジタル技術を活用する」ことが、競争上の優位性確立に不可欠となります。

この記事では、効果的な活用が難しい「非構造化データ」に焦点を当て、基本的な考慮事項や活用の方向性を解説します。

データの種類

企業が利用しているデータは、大まかに2つの種類に分けられます。

1つ目は、列や行で構造が定義された「構造化データ」で、検索やデータの解析・分析のために最適化されています。2つ目は規則性がなく構造が定義されていない「非構造化データ」です。

非構造化データは、個々の目的によって作成されるため、データの配列や構造に一貫性がなく、そのままでは検索やデータ解析・分析が困難です。通常、これらのデータの保有比率は2:8と言われており、非構造化データが圧倒的に多いため、DXの推進においては、この膨大な非構造化データを効果的に活用することが重要となります。

構造化データと非構造化データの違い
構造化データと非構造化データの違い

非構造化データに関する3つの課題

非構造化データを活用する際の主な課題は、「管理」「保護」「活用」の3つがあります。

図で示したように、「管理」と「保護」は活用するための土台となり、非構造化データを効果的に活用するためには、まずはこれらの課題に対処する必要があります。

非構造化データ活用の課題
非構造化データ活用の課題

管理の課題

非構造化データの管理には、収集、把握、保管の適切な実施が必要です。保有しているデータの把握(どこにどのようなデータが存在するか)ができていなければ、活用はできません。

一昔前は、企業のシステム環境は把握可能な範囲に集約されていたため、業務で利用するデータも自社のシステム環境内にまとまって存在していました。しかし、最近のクラウド化の進展により、企業が利用するデータは自社内のシステムにとどまらず、インターネット上の様々な場所に分散しているのが一般的です。

情報セキュリティの観点からも、「境界型防御からゼロトラストへ」という考え方が進んでいるのは、このような環境の変化が理由の一つです。

データの把握

非構造化データがある程度まとまった場所に存在する場合、「どこにどのようなデータが存在するか」を把握することは比較的容易です。

しかし、最近の環境では、自社のシステム以外にもIaaS上のシステムやSaaSなど、様々な外部環境に非構造化データが分散しており、「どこにどのようなデータが存在するか」を正確に把握することは非常に困難です。

たとえば、全社ファイルサーバーはオンプレミス、Microsoft SharePointサイトも利用しており、ファイル共有はMicrosoft OneDrive、SFAやCRMの添付ファイル、基幹系システムにも添付ファイルがある。ある部門はパートナー企業とのファイル連携にGoogle Driveを利用し、Boxを使っている部門も一部あり、Slackを使って顧客とファイルのやり取りをしているプロジェクトもあるなど、こうした状況は一般的です。

バージョン管理/データ量

インターネット上の様々な場所にデータが分散している環境では、多数の複製ファイルが作成されて分散・サイロ化していることで「どれが最新版か不明」といったバージョン管理の問題や、データ量が膨大に増え続けることによる保管の課題も生じます。

保護の課題

可用性・機密性・完全性を保つことは、データを安心して活用するために非常に重要です。保護の課題においても管理の課題と同様に、利用サービスの多様化やデータの分散が問題となっています。

ガバナンス低下

特にSaaSにおけるセキュリティ機能はサービスごとに異なる仕様の範囲内で提供されます。企業が統一的なセキュリティ基準を定めていても、一部のサービスはその基準を満たしていないこともあり、運用によってセキュリティを補完する必要があります。

セキュリティレベルが統一されていない状況は、複数のSaaSを利用する場合において頻繁に発生し、ガバナンスの低下の要因となり、設定の漏れや管理コストの上昇の原因にもなります。

DX推進で挙げられる課題として「レガシーシステムの維持に関する負担」がありますが、ガバナンスが適切に機能しない場合は、最新のクラウド利用においても同様の課題が生じる場合があります。

情報漏洩対策/利用状況の把握

外部からの不正アクセスやサイバー攻撃への対策と同様に、内部での不適切な利用や情報漏洩への対策として利用状況を把握し、不正行為を検知できるようにすることも重要です。

活用の課題

DXに有用なデータを保有していても、そのデータを活用できなければ意味がありません。DX推進にはデータを「分析」し「可視化」することが不可欠です。

変換/加工

非構造化データは基本的に個々のファイルが異なる目的で作成されており、規則性がなく構造が定義されていないため、そのままではDXの目的に適した効果的な活用が困難です。

活用のために最適化されていないデータでは、優れた分析ツールやAIを活用しても最良の結果を得られません。したがって、非構造化データを活用するためには変換や加工が必要です。

分析/可視化

誤った課題認識として、膨大なデータから必要なものを素早く見つけて利用できるようにする、全社検索システム(エンタープライズサーチ)の利用があります。

エンタープライズサーチは基本的には業務効率化や省力化を図るためには効果的ですが、DXの目的に必ずしも沿っているわけではありません。DXでは既存事業の効率化や省力化を超えて「変革」を目指すべきです。

そのため、検索性の向上だけでなく「分析」と「可視化」によって既存事業に対する付加価値向上での差別化や、新規事業の創出などを目的として、データを効果的に活用可能にすることが重要です。

非構造化データ活用の方向性

ここまでは、DX推進に不可欠な非構造化データの活用における主な課題を解説してきました。

次は非構造化データを有効活用するための方向性を示します。

非構造化データの集約管理

「管理の課題」で示した通り、多くの企業では非構造化データが分散し、サイロ化しています。この状況はガバナンスの低下や管理の複雑化、セキュリティ上の問題を引き起こしやすくなるため、非構造化データはできるだけ集約管理することが望ましいです。

ただし、集約するだけでなく、増加し続けるデータ量への対策やバージョン管理、バックアップ、セキュリティについても考慮する必要があります。

ソリューションの選定

集約管理に適したプロダクトを検討する際には、まず自社で利用しているシステムを一覧化し、それぞれのシステムがどのような非構造化データを保有しているかを整理する必要があります。その上で、データ量やセキュリティ要件、業務プロセスにおける非構造化データの取り扱い方などを考慮し、プロダクトに求める要件を整理します。

ラックでは非構造化データの最適な管理方法として「Box」を提供しています。Boxは1,500以上の外部アプリケーションとの連携(各サービスの非構造化データの保存先などとして利用可能)に対応しているため、分散していた非構造化データを1か所に集約できます。

また、容量とバージョン管理を無制限で提供しているため、ストレージの増設やバックアップの心配がなくなり、基盤運用コストの削減に大きく貢献します。さらに、多くの国際的なセキュリティ基準に準拠した基盤を提供し、全てのファイルに対する過去7年分の操作ログが保管されるため、データ保護の観点でも安心できます。

データ分析基盤/BIツールの活用

データ分析基盤/BIツールを活用することは、DXに効果的なヒントを得ることにつながります。

ソリューションの選定

まずはデータ活用によって生み出す付加価値の目標を設定し、その目標達成に役立つデータを特定します。データ分析基盤は通常、データの蓄積量に応じてコストが増えるため、対象データを必要最小限に絞ることでコストを最小化できます。

次に、活用したいデータの形式を確認します。非構造化データと一口に言っても、文書やログ、音声、画像など様々な形式があり、製品によって扱えるデータ形式の制限や得意不得意があるため、活用したいデータの形式も選定の判断基準となります。

また、データの変換機能の有無や変換可能なデータ形式の制限も確認しておく必要があります。将来的な利用状況に応じたスケールアップやスケールアウトの柔軟性も重要な検討要素となります。

実現可能性の確認

どのソリューションを採用する場合でも「活用に関する実現可能性」はPoCなどを通じ十分に評価しておく必要があります。

データを処理するのはシステムですが、それを扱うのは人であるため、担当者の育成やマニュアルの準備、場合によってはデータサイエンティストの確保などが必要となる場合があります。

なお、ラックでは、データ分析基盤として「Elastic Stack」を提供しています。Elastic Stackは、あらゆるデータソースやデータ形式に対してリアルタイムな検索、分析、可視化が可能であり、データ量や利用状況に応じた柔軟なスケーラビリティを備えているため、常に最適なコストで快適なデータ分析が可能です。

DX実現に向けた考え方

本記事では、DX実現に不可欠な「非構造化データの活用」について取り上げました。しかし、ご説明した内容はあくまでも「手段」に他なりません。

DXの検討段階において「データサイエンスやAIを使って何かできないか?」と考えがちですが、優れたツールや先端技術の導入だけではDXの実現にはつながりません。手段を先行して導入しても、効果が出なかったり使われなかったりすればDXは進まず、無駄な投資になる可能性もあります。

そのため、DX推進のためには経営層がビジョンや戦略を示し、明確な目標と方向性を持つことが重要です。その上で、達成に必要となる適切な手段を選択していくことが求められます。

また、DXレポート2.2(概要)では、経営層はビジョンや戦略に加えて、社員全員が新しい仕事のやり方や働き方に順応できるように行動指針を示す必要があると述べられています。つまり、社員の意識改革や企業文化の変革もDX推進において重要な要素となるのです。

経営者自身がDXの意味を正しく理解し、社員に対してビジョンや行動指針を示し、推進のリーダーシップを発揮することが、全社的なDXの推進に貢献し、産業全体のDXにつながっていくと考えられます。

ラックでは、サイバーセキュリティはもちろん、DX実現を目指したコンサルティングやシステム導入など、企業のIT活用に関する幅広い支援を行っています。お気軽にご相談ください。

より詳しく知るにはこちら

より詳しく知るにはこちら

「ITコンサルティング」に関するお問い合わせ

この記事は役に立ちましたか?

はい いいえ

関連記事

LAC WATCH

関連記事をご紹介します

  • Boxをランサムウェアに感染させたらどうなる?~感染から復元までを再現

  • ファイルを盗み出そうとする人の気持ちになり考えてみた~Boxの設定を見直そう~

  • 「2025年の崖」を乗り越えよう!今からでも遅くない、レガシーシステム脱却のすすめ