AWS Glue Studioのデータ準備機能で、データ分析がより身近に

AWSは、AWS Glue Studio Visual ETLでデータ準備オーサリング機能が一般公開されたことを発表しました。これは、ビジネスユーザーやデータアナリストが、コードを書かずにデータのクリーニングや変換を行える、新しいノーコードのデータ準備ユーザーエクスペリエンスです。
今回の発表で特に興味深いのは、スプレッドシートスタイルのUIでデータ統合ジョブを構築できるようになった点です。従来、データの準備作業は、専門的な知識を持つエンジニアが行うことが一般的でした。しかし、この新しい機能により、ビジネスユーザーやデータアナリストといった、よりデータに近い立場の人々が、自らデータ準備作業を行えるようになります。
例えば、マーケティング部門の担当者が、顧客データの分析を行う際に、従来であればデータエンジニアに依頼してデータのクリーニングや変換を行ってもらっていましたが、この機能を使うことで、自らデータ準備作業を行い、必要なデータを必要な形式で入手することが可能になります。
また、既存のAWS Glue DataBrewのデータクレンジングおよび準備「レシピ」を新しいAWS Glueデータ準備エクスペリエンスにインポートできる点も魅力的です。これにより、DataBrewで作成したレシピをGlue Studioで直接編集し、大規模なデータ処理にも対応できるようになります。
さらに、データエンジニアとビジネスアナリストが連携してデータ統合ジョブを構築できるようになる点も注目すべき点です。データエンジニアは、Glue Studioのビジュアルフローベースのビューを使用して、データへの接続を定義し、データフロープロセスの順序を設定できます。一方、ビジネスアナリストは、データ準備エクスペリエンスを使用して、データ変換と出力を定義できます。
このように、AWS Glue Studioのデータ準備機能は、データ分析の民主化を促進し、より多くの人々がデータから価値を引き出せるようにするものです。これまでデータ分析に携わっていなかった人々も、この機能を使うことで、簡単にデータ分析を始められるようになるのではないでしょうか。
参照元サイト:Integrate your data and collaborate using data preparation in AWS Glue Studio