ja

技術専門家のためのDataiku

大規模な機械学習のための迅速な実験と運用可能化。
「一番のメリットは一ヶ所にすべてあることです。このためプログラム間を行き来してすべてを同時に稼働させる必要はありません。Dataiku のおかげで手間が省けるのです。」 データサイエンティスト、アイチャ・カンドール氏 Aviva

多様なコーディング環境やGitとの統合

パイプラインや機械学習モデルを構築するには、Dataikuのビジュアルツールを使用するか、あるいは、Python、R、Scala、Julia、Pysparkなどの言語でカスタムコードを記述し、お気に入りの統合開発環境(IDE)で開発・編集できます。

Gitの統合により、プロジェクトのバージョン管理とトレーサビリティを実現し、さらに、コード開発とCI/CDの両方の目的で、チームが外部ライブラリ、ノートブック、リポジトリを簡単に組み込むことが可能です。

Dataikuの拡張性の機能を見る

既存のインフラの活用

Dataikuはインフラにとらわれないモジュラーアーキテクチャーを採用しているため、SaaSアプリケーション、オンプレミス、クラウドのいずれにも対応し、各クラウドのネイティブストレージや計算レイヤーと統合することができます。

Amazon Web Services (AWS)、Google Cloud Platform (GCP)、Microsoft Azure上で高速化されたインスタンステンプレートは、Dataiku実装の管理と運用を効率化します。最新のプッシュダウンアーキテクチャーにより、SnowflakeなどのSQLデータベース、Spark、Kubernetesなど、弾力的で拡張性の高いコンピューティングシステムを活用できます。

Dataikuのアーキテクチャー機能を見る

パイプラインとモデルの運用を容易に

Dataikuのフローは、データ変換と移動のパイプラインをエンドツーエンドで表します。また、フローで表現されたツールにより、エンジニアは進化するデータパイプラインにおけるデータの依存関係やスキーマの一貫性を管理することができます。

Dataikuを使えば、データのロードや処理、バッチスコアリングジョブの実行、計算リソースの割り当て、データ品質チェックなどの反復作業を自動化できます。

DataikuのDataOpsの機能を見る

設計からデリバリーまでを単一のAIプラットフォームで

バッチデータパイプラインのデプロイ、またはAPIサービスによるリアルタイムのモデルスコアリングを提供します。

自動パフォーマンスモニタリングとモデルの再トレーニングにより、デプロイされたモデルが健全な状態に保たれます。モデルが劣化した場合、堅牢なドリフト分析とモデル比較により、本番環境にデプロイする適切なモデルについて、情報に基づいた意思決定を行うことができます。

DataikuのMLOps機能を見る

AutoMLでモデルを迅速に構築

Dataiku AutoMLを活用することで、アルゴリズムとハイパーパラメーターの複数の組み合わせにわたって、自動化された実験追跡により、クラス最高レベルのモデルを迅速に作成できます。デフォルト設定を使うか、あるいは独自のカスタムモデルやディープラーニングモデルの作成をするなど、特徴量処理や学習のあらゆる設定を制御できます。

パフォーマンスレポート,モデルの説明可能性,what-if 分析のためのインタラクティブなツールを含む強力なフレームワークで、コンピュータビジョン、時系列予測、クラスタリング、その他の特殊な ML モデルを構築し、評価することができます。

Dataikuの機械学習の機能を見る

効率性を最大化するためのアセットを見つけ再利用

Dataikuのカタログ、フィーチャーストア、プロジェクトホームページ、プラグインストアのような中央のハブを通じて、チームは簡単に既存のプロジェクトやデータプロダクトを見つけ、再利用することができます。

コーダーは、スクリプト作業を迅速化し、誰もがデータ操作のための一貫した方法論を適用していることを確認するために、Gitからインポートされたものなど、有用なコードスニペットやライブラリの共有バンクを利用できます。

Dataikuのコラボレーション機能を見る