Databricks「データレイクハウス、統合によるイノベーション」


Lakehouse、統一されたガバナンス、データの単一コピーによる生産性の向上

本日25日、Databricksは毎年恒例のグローバルイベント「Data + AI World Tour」を韓国で初めてオフラインで成功裏に開催した。

「Destination Lakehouse」というテーマで開催されるデータ + AI ワールド ツアーでは、最新化されたデータ スタックを構成する主要な要素と、企業がデータ資産をすぐに使用してより効果的なビジネスを行うことを可能にする主要な要素に焦点を当てます。 AI の決定と実装の成功。 データ レイクハウスに焦点を当てます。

Databricks の Data Lakehouse は、データ レイクの柔軟性、費用対効果、スケーラビリティをデータ ウェアハウスのデータ管理機能と組み合わせて、すべてのデータのビジネス インテリジェンス (BI) と機械学習を可能にするオープンな統合データ プラットフォームです。 .

このイベントでは、全国のデータと AI の専門家が参加し、アイデアとベスト プラクティスを共有しました。 Gmarket、Emart24、Devsisters、Hanwha、Mezzomedia、Job Korea、Finda、Weverse Company、Musinsa などの主要な国内企業のデータおよび AI リーダーが、講演者と同様にデータ イノベーションの旅を共有しました。

そんな中、DatabricksのオープンソースAIモデル「Dolly」の新バージョン「Dolly 2.0」がリリースされ、注目を集めた。 Dolly 2.0 は、大規模なオープンソースのコマンド追従言語モデル (LLM) であり、研究や商用利用に利用できるコマンド学習データセットを改良することによって実装されています。 Databricks は、IllutherAI の Pythia モデル ファミリーに基づく 120 億のパラメーター言語モデルを使用して、スタッフから高品質の注文追跡データセットを改良しました。

Databricks は、ドリー 2.0 のトレーニング コード、データセット、ドリー モデルのトレーニング済みの重みなど、商用利用のためのすべてをオープン ソースで提供します。 これにより、組織は、API アクセスに料金を支払ったり、サードパーティとデータを共有したりすることなく、人間と対話できる LLM を作成、所有、およびカスタマイズできます。

Databricks のブランチ マネージャーであるチャン ジョンウク (Jang Jeong-wook) 氏は、歓迎の挨拶で次のように述べています。 , 技術的な側面に加えて, 組織と人員の準備が重要です.

支店長のチャン・ジョンウクは、次のように述べています。 複数の企業とともに、データと AI エコシステムのオープンな基盤を形成しています。 国内外の多くの企業が当社の可能性を認め、共に成長しています。 現在、世界中で 9,000 社の企業が「数十の組織が当社のプラットフォームを使用していることが証明されています。当社は、企業のデータ ニーズを満たすために、迅速かつ低コストのイノベーションで企業をサポートします。」

Databricks Asia-Pacific のシニア バイス プレジデントである Ed Renta 氏は、基調講演で次のように述べています。作成することが重要です。 今日の企業は、データ駆動型の企業になろうとしています。」

「データと AI の成熟度は、反応的な意思決定から予測的で自動化された意思決定へと移行しています。私たちのビジョンを顧客に伝える方法。その結果、私たちはオーストラリア、シンガポール、香港、日本、韓国に到達しました。私たちは90% の成長と労働力の増加を達成しました。前年比 80% で、アジア太平洋地域全体で 600 人を超える専門家が技術サポートを提供しています。」

2 番目の基調講演を行った Databricks Global Fields の CTO である Chris Diagostino 氏は、次のように述べています。 、多くの時間とお金が投資されています。

彼は続けて、「この観点から Lakehouse を構築することが重要です。それは iPhone の外観に似ています。複数の電子デバイスの機能が単一の環境で提供されます。Lakehouse プラットフォームは統一されたガバナンスを持ち、1 つのコピーのオーケストレーション、データ サイエンスと機械学習、ガバナンス、データ ウェアハウス、ストリーミング、BI を可能にします。」

企業クライアントとして基調講演に参加した Emart24 の CIO である Jaekyung Lee 氏は、「2021 年 11 月から継続されているこのタスクは、AI モデルの開発を通じて、ビッグデータ インフラストラクチャの構築からビッグデータ タスクの選択にまで及びました。とサービス、そして最終的にデータの文化を構築する.過去には、「私は複雑さとチームメイトとの働き方に問題がありました」と彼は言いました.

彼は続けて、「私たちは AI 製品レコメンデーション サービスを開発しました。店舗に推奨されるこのサービスは、Databricks プラットフォームを使用してデータとアルゴリズムを最適化し、コンピューティング リソースを最適化します。分析時間は 1 時間、分析リソースのコストは 70,000 ウォンです。今後は商品企画、ロジスティクス、マーケティング、店舗での販売管理、店舗展開などで Databricks プラットフォームを活用していく予定です。」

「エンタープライズ データ統合によるデータ価値の最大化」について講演するハンファ DT の戦略チームの CTO である Giseon Han 氏は、次のように述べています。グローバルな市場環境の変化に基づいた機械学習領域への製品価格と株価予測。

3回目の発表を担当したDevsistersのCTOであるソンジン・ホン氏は「ゲームの性質上、ユーザー数やトラフィックが多い。 定期的な新しいリリース、不十分なデータ エクスペリエンス、リリース後の急速なデータ増加に悩まされていました。」

「Databricks は、SQL や Python などのさまざまなコンピューター言語でも、生産性の高いプラットフォームをすべての人に提供してきました。 データ マイニングと分析のエクスペリエンスも向上しました。 そのため、データレイクをレイクハウスに移行することで生産性を向上させました。 SQL ベースのワークフローは生産性を高め、さまざまなデータ エンジニアがプロジェクトに貢献できる構造に進化しました。 »

一方、この日は「Korea Data + AI Awards 2023」も開催され、データと AI を使用して業務に革新をもたらした各組織からデータ チームを選出しました。 合計 5 つの Databricks カスタマー チームが賞を受賞しました。 Weverse Company は Data + AI Transformation Award 部門を受賞し、Devsisters は Data + AI Visionary Award 部門を受賞しました。 続いてムシンサはData+AI Democratization Award、データ+AI Executive AwardのEmart24 CIO Lee Jae-kyung、Data+AI Champion AwardのGmarketのプラットフォーム技術マネージャーSeo Dae-hongを受賞した。

「データ レイクハウスのパイオニアとして、私たちはデータと AI を誰もが利用できるように努めています。このイベントは、全国のデータおよび AI 業界のリーダーがアイデアやベスト プラクティスを共有し、Databricks 製品のイノベーション トレンドを確認するための非常に有益な場です。

「特に、このイベントで初めて Databricks Korea Customer Awards を開催し、新世代のイノベーションをリードする国家データおよび AI チームと、業界のビジョンを提示するリーダーの貢献を評価することは重要です。

ハローティのソ・ジェチャン記者 |

Wakabayashi Ken

「フリーランスのコミュニケーター。筋金入りのウェブ開業医。起業家。全学生。ビール忍者。」

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です