このコースは、AWS 上のデータエンジニアリングの実践とソリューションを学べる中級者向けのコースです。AWS サービスを利用したデータエンジニアリングソリューションの設計、構築、最適化、セキュリティ確保について座学とハンズオンラボを通じて学びます。基礎概念からデータレイク、データウェアハウス、バッチおよびストリーミングデータパイプラインの実践的な実装まで、モダンデータ分析パイプラインを大規模に設計・管理するために必要なスキルを習得できます。
| 開催日 | 場所 | 受付状況 | 空席状況 | 受付締切 |
|---|---|---|---|---|
| 11月25日(水) 〜 11月27日(金) | オンラインLive(トレノケート社) | 受付中 | △残席わずか | 11月10日(火) |
・AWSにおけるデータエンジニアリングを学びたい方
・データエンジニアを目指すソリューションアーキテクトや DevOps エンジニアの方
以下の技術的知識をお持ちの方を対象としています。
□データベースの概念の知識
□一つ以上のプログラミング言語またはスクリプト言語の知識
□クラウドコンピューティングの概念の知識
□AWS Cloud Practitioner Essentials および AWS Technical Essentials を修了または、同等の知識がある方(必須)
当コースを修了した時点で、次のことができることを目標とします。
● AWS でスケーラブルなデータレイクとデータウェアハウスを設計して実装できる
● バッチデータ処理パイプラインを構築、最適化、保護する仕組みを理解する
● ストリーミングデータソリューションを開発および管理する仕組みを理解する
● データガバナンスとセキュリティにベストプラクティスを適用できる
● AWS サービスを使用してデータエンジニアリングワークフローを自動化する手法を理解する
● データソリューションのアクセスコントロールとセキュリティ対策を実装できる
1. データエンジニアリングのロールと主要なコンセプト
- データエンジニアのロール
- データ分析システムのデータ検出
- データワークフローのための AWS サービス
- 継続的インテグレーションと継続的デリバリー
- ネットワークの考慮事項
2. データレイクの設計と実装
-データレイクの紹介
-データレイクストレージ
-データの取り込み
-データのカタログ化
-データの変換
-データの提供と活用
-(ラボ 1)AWS でデータレイクを設定する
3. データレイクソリューションの最適化と保護
- パフォーマンスの最適化
- Lake Formation を利用したセキュリティ
- Lake Formation によるアクセス許可の設定
- セキュリティとガバナンス
- トラブルシューティング
-(ラボ 2)AWS Lake Formation ブループリントを使用したデータレイク作成の自動化
4. データウェアハウスのアーキテクチャと設計原則
- データウェアハウスの概論
- Amazon Redshift の概要
- Amazon Redshift へのデータの取り込み
- データの処理
- データの提供と活用
-(ラボ 3)Amazon Redshift Serverless を使用したデータウェアハウスのセットアップ
5. データウェアハウスのパフォーマンス最適化の手法
- モニタリングと最適化のオプション
- Amazon Redshift でのデータ最適化
- Amazon Redshift でのクエリ最適化
- データオーケストレーション
6. データウェアハウスのセキュリティとアクセスコントロール
- Amazon Redshift での認証とアクセスコントロール
- Amazon Redshift のデータセキュリティ
-(ラボ 4)Amazon Redshift での作業
7. バッチデータパイプラインの設計
- バッチデータパイプラインの概要
- バッチデータパイプラインの設計
- バッチデータの取り込み
8. バッチ処理の実装戦略
- データの処理と変換
- データ形式の変換
- データの統合
- データのカタログ化
- データの提供と活用
-(ラボ 5)データエンジニアの業務フロー
9. バッチデータパイプラインの最適化、オーケストレーション、保護
- バッチデータパイプラインの最適化
- バッチデータパイプラインのオーケストレーション
- バッチデータパイプラインの保護
-(ラボ 6)AWS Step Functions を使用した Spark でのデータ処理のオーケストレーション
10. ストリーミングデータのアーキテクチャパターン
- ストリーミングデータパイプラインの概要
- ストリームソースからのデータの取り込み
- ストリーミングデータの保存
- ストリーミングデータの処理
- ストリーミングデータの分析
-(ラボ 7)Amazon Managed Service for Apache Flink によるストリーミング分析
11. ストリーミングソリューションの最適化と保護
- ストリーミングデータソリューションの最適化
- ストリーミングデータパイプラインの保護
-(ラボ 8)Amazon Managed Streaming for Apache Kafka を使用したアクセスコントロール
12. コンプライアンスとコスト最適化
- コンプライアンスに関する考慮事項
- コスト最適化ツール
このコースには演習が含まれており、学習したスキルを試す機会となるとともに、実際の作業環境に応用できるようになります。
- ラボ 1: AWS でデータレイクを設定する
- ラボ 2: AWS Lake Formation ブループリントを使用したデータレイク作成の自動化
- ラボ 3: Amazon Redshift Serverless を使用したデータウェアハウスのセットアップ
- ラボ 4: Amazon Redshift での作業
- ラボ 5: データエンジニアの業務フロー
- ラボ 6: AWS Step Functions を使用した Spark でのデータ処理のオーケストレーション
- ラボ 7: Amazon Managed Service for Apache Flink によるストリーミング分析
- ラボ 8: Amazon Managed Streaming for Apache Kafka を使用したアクセスコントロール
ITSS+ 共通スキルレベル:3
AWS Certified Data Engineer – Associate
| キャンセル規定 | 受講開始15日前から受講料(購入価格)の100%のキャンセル料がかかります。 |
|---|---|
| テキスト | ●AWS Builder Labs へのサインインについて |
| オンラインクラス | [Liveオンライン研修] |
| その他 | ・AWS認定試験のご受験は後日AWSトレーニングポータルよりお申し込みください。コース中には受験しません。 ・受験用バウチャは、コースのご受講時に、MyTrainocatePortalにて受講者の方へお渡しします。 |
当コースはトレノケート株式会社 直営クラスへのご案内となります。