技術専門家のためのDataiku
大規模な機械学習のための迅速な実験と運用可能化。
「一番のメリットは一ヶ所にすべてあることです。このためプログラム間を行き来してすべてを同時に稼働させる必要はありません。Dataiku のおかげで手間が省けるのです。」データサイエンティスト、アイチャ・カンドール氏 Aviva
多様なコーディング環境やGitとの統合
パイプラインや機械学習モデルを構築するには、Dataikuのビジュアルツールを使用するか、あるいは、Python、R、Scala、Julia、Pysparkなどの言語でカスタムコードを記述し、お気に入りの統合開発環境(IDE)で開発・編集できます。
Gitの統合により、プロジェクトのバージョン管理とトレーサビリティを実現し、さらに、コード開発とCI/CDの両方の目的で、チームが外部ライブラリ、ノートブック、リポジトリを簡単に組み込むことが可能です。
既存のインフラの活用
Dataikuはインフラにとらわれないモジュラーアーキテクチャーを採用しているため、SaaSアプリケーション、オンプレミス、クラウドのいずれにも対応し、各クラウドのネイティブストレージや計算レイヤーと統合することができます。
Amazon Web Services (AWS)、Google Cloud Platform (GCP)、Microsoft Azure上で高速化されたインスタンステンプレートは、Dataiku実装の管理と運用を効率化します。最新のプッシュダウンアーキテクチャーにより、SnowflakeなどのSQLデータベース、Spark、Kubernetesなど、弾力的で拡張性の高いコンピューティングシステムを活用できます。
設計からデリバリーまでを単一のAIプラットフォームで
バッチデータパイプラインのデプロイ、またはAPIサービスによるリアルタイムのモデルスコアリングを提供します。
自動パフォーマンスモニタリングとモデルの再トレーニングにより、デプロイされたモデルが健全な状態に保たれます。モデルが劣化した場合、堅牢なドリフト分析とモデル比較により、本番環境にデプロイする適切なモデルについて、情報に基づいた意思決定を行うことができます。
AutoMLでモデルを迅速に構築
Dataiku AutoMLを活用することで、アルゴリズムとハイパーパラメーターの複数の組み合わせにわたって、自動化された実験追跡により、クラス最高レベルのモデルを迅速に作成できます。デフォルト設定を使うか、あるいは独自のカスタムモデルやディープラーニングモデルの作成をするなど、特徴量処理や学習のあらゆる設定を制御できます。
パフォーマンスレポート,モデルの説明可能性,what-if 分析のためのインタラクティブなツールを含む強力なフレームワークで、コンピュータビジョン、時系列予測、クラスタリング、その他の特殊な ML モデルを構築し、評価することができます。
効率性を最大化するためのアセットを見つけ再利用
Dataikuのカタログ、フィーチャーストア、プロジェクトホームページ、プラグインストアのような中央のハブを通じて、チームは簡単に既存のプロジェクトやデータプロダクトを見つけ、再利用することができます。
コーダーは、スクリプト作業を迅速化し、誰もがデータ操作のための一貫した方法論を適用していることを確認するために、Gitからインポートされたものなど、有用なコードスニペットやライブラリの共有バンクを利用できます。