ビッグデータ

Falcon LLM: オープンソース LLM の新たな王様 – KDnuggets

タイムスタンプ: 7 年 2023 月 XNUMX 日 10：00
ソースノード: 2544928

プラトン再発行

編集者による画像

私たちは毎週、大規模言語モデル (LLM) が吐き出され、使用できるチャットボットがますます増えているのを目にしてきました。ただし、どれが最適なのか、それぞれの進捗状況、どれが最も役立つのかを判断するのは難しい場合があります。

抱き合う顔には、リリースされる LLM を追跡、評価、ランク付けする Open LLM Leaderboard があります。彼らは、さまざまな評価タスクで生成言語モデルをテストするために使用される独自のフレームワークを使用します。

最近では、LLaMA (Large Language Model Meta AI) がリーダーボードのトップにありましたが、最近、新しい事前トレーニングされた LLM – Falcon 40B にその座を奪われています。

による画像 HuggingFace オープン LLM リーダーボード

ファルコンLLM によって設立され、建設されました。技術革新研究所 (TII) は、アブダビ政府の先端技術研究評議会の一員である企業です。政府はアラブ首長国連邦全土の技術研究を監督しており、科学者、研究者、エンジニアのチームが革新的な技術や科学の発見を提供することに重点を置いています。

ファルコン-40B は 40B のパラメータを備えた基本的な LLM で、40 兆のトークンでトレーニングされます。 Falcon XNUMXB は自己回帰デコーダ専用モデルです。自己回帰デコーダ専用モデルとは、前のトークンが与えられたシーケンス内の次のトークンを予測するようにモデルがトレーニングされていることを意味します。 GPT モデルはその良い例です。

Falcon のアーキテクチャは、トレーニングコンピューティング予算のわずか 3% で GPT-75 を大幅に上回っており、必要なのは ? のみであることが示されています。推論時の計算の。

LLM はトレーニングデータの品質に非常に敏感であることがわかっているため、Technology Innovation Institute のチームは大規模なデータ品質に重点を置いています。チームは高速処理のために数万の CPU コアにスケールするデータパイプラインを構築し、広範なフィルタリングと重複排除を使用して Web から高品質のコンテンツを抽出することができました。

別の小さいバージョンもあります。ファルコン-7B これには 7 億のパラメータがあり、1,500 億のトークンでトレーニングされています。同様に Falcon-40B-命令, Falcon-7B-命令すぐに使用できるチャットモデルをお探しの場合は、さまざまなモデルが利用可能です。

ファルコン 40B では何ができるのでしょうか?

他の LLM と同様に、Falcon 40B は次のことができます。

クリエイティブなコンテンツを生成する
複雑な問題を解決する
カスタマーサービス業務
仮想アシスタント
言語変換
感情分析。
「繰り返しの」作業を削減し、自動化します。
エミレーツ企業の効率化を支援

Falcon 40B はどのように訓練されましたか?

1 兆のトークンでトレーニングされるため、384 か月にわたって AWS 上に 1,000 個の GPU が必要でした。 XNUMXB トークンでトレーニング済み洗練されたウェブ、TII によって構築された大規模な英語の Web データセット。

事前トレーニングデータは、Web からの公開データのコレクションで構成されています。コモンクロール。チームは徹底的なフィルタリングフェーズを経て、機械生成テキスト、アダルトコンテンツ、および重複排除を除去して、XNUMX 兆近くのトークンの事前トレーニングデータセットを作成しました。

CommonCrawl 上に構築された RefinedWeb データセットは、厳選されたデータセットでトレーニングされたモデルよりも優れたパフォーマンスを達成するモデルを示しています。 RefinedWeb はマルチモーダルにも対応しています。

準備が完了すると、Falcon は EAI Harness、HELM、BigBench などのオープンソースベンチマークに対して検証されました。

彼らが持っているオープンソースの Falcon LLM Falcon 40B および 7B は、Apache License Version 2.0 リリースに基づいているため、研究者や開発者にとってよりアクセスしやすくなりました。

LLM は、かつては研究および商用利用のみを目的としていたが、AI への包括的なアクセスを求める世界的な需要に応えるために、現在はオープンソースとなっている。 UAE は AI 内の課題と境界を変え、AI が将来どのように重要な役割を果たすかに注力しているため、現在は商用利用制限によるロイヤルティが免除されています。

AI の世界でコラボレーション、イノベーション、知識共有のエコシステムを育成することを目的とした Apache 2.0 は、セキュリティと安全なオープンソースソフトウェアを保証します。

チャットボットのスタイルで一般的な命令に適した、よりシンプルなバージョンの Falcon-40B を試したい場合は、Falcon-7B を使用することをお勧めします。

それでは始めましょう…

まだインストールしていない場合は、次のパッケージをインストールします。

!pip install transformers
!pip install einops
!pip install accelerate
!pip install xformers

これらのパッケージをインストールしたら、提供されているコードの実行に進むことができます。ファルコン 7-B 指示:

from transformers import AutoTokenizer, AutoModelForCausalLM
import transformers
import torch model = "tiiuae/falcon-7b-instruct" tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline( "text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto",
)
sequences = pipeline( "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", max_length=200, do_sample=True, top_k=10, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id,
)
for seq in sequences: print(f"Result: {seq['generated_text']}")

Falcon は、利用可能な最高のオープンソースモデルとして LLaMA の栄冠を獲得しました。人々は、その強力に最適化されたアーキテクチャ、独自のライセンスを持つオープンソース、および 40B と 7B パラメータの XNUMX つのサイズで利用できることに驚きました。

試してみたことがありますか？もしそうなら、コメントであなたの意見を教えてください。

ニシャ・アリア KDnuggets のデータサイエンティスト、フリーランステクニカルライター、およびコミュニティマネージャーです。彼女は特に、データサイエンスに関するキャリアアドバイスやチュートリアル、およびデータサイエンスに関する理論に基づく知識を提供することに関心を持っています。彼女はまた、人工知能が人間の寿命を延ばすためのさまざまな方法を探求したいと考えています。熱心な学習者であり、他の人を導く手助けをしながら、技術知識とライティングスキルを広げようとしています。

このトピックの詳細

SEO を活用したコンテンツと PR 配信。今日増幅されます。
EVMファイナンス。分散型金融のための統一インターフェイス。こちらからアクセスしてください。
クォンタムメディアグループ。 IR/PR増幅。こちらからアクセスしてください。
プラトアイストリーム。 Web3 データインテリジェンス。知識増幅。こちらからアクセスしてください。
情報源： https://www.kdnuggets.com/2023/06/falcon-llm-new-king-llms.html?utm_source=rss&utm_medium=rss&utm_campaign=falcon-llm-the-new-king-of-open-source-llms

タグ： 000, 1, 10, 384, 7, 75, a, できる, アブダビ, 加速する, アクセス, アクセス可能な, 達成する, 成人, 高度な, 先端技術, アドバイス, に対して, AI, 目指す, すべて, 既に, また, an, 分析, &, 動物, 動物, 別の, どれか, アパッチ, アラブ, 建築, です, 周りに, 人工の, 人工知能, AS, 組み立て, アシスタント, At, オート, 自動化する, 利用できます, AWS, ベース, BE, になる, き, さ, と考えています, ベンチマーク, 恩恵, BEST, 優れた, 境界, 広げる, 予算, 構築された, by, 缶, キャリア, キャリアアドバイス, 応じます, 課題, 変化, チャット, チャットボット, チャットボット, コード, 環境、テクノロジーを推奨, コレクション, 注釈, コマーシャル, コミットした, コミュニティ, 企業, 会社, 比べ, 複雑な, 計算, 構成された, コンテンツ, 協議会, CPU, クリエイティブ, クラウン, 耕す, キュレーション, 顧客, 顧客サービス, データ, データパイプライン, データ品質, データサイエンス, データサイエンスのキャリア, データサイエンティスト, データセット, データセット, デコーダ, 配信する, 需要, 開発者, アブダビ, 異なります, 発見, 各, EARTH, エコシステム, エディタ, 効率的な, エミレーツ航空, エミラティ, エンジニア, 英語, 確実に, 評価, あらゆる, 例, 探る, 広範囲, エキス, 顔, ファルコン, スピーディー, フィギュア, フィルタリング, 5, フォーカス, フォロー中, , 基礎, 設立, フレームワーク, 無料版, フリーランス, 優しい, 　, 未来, 生成する, 生成された, 世代。, 生々しい, ジェネリック, 入手, 始めます, 与えられた, グローバル, 良い, 政府・公共機関, gpt, GPT-3, GPU, ガイド, 持っていました, ハード, ハーネス, 持ってる, ポート, カスタマーサービス, 助け, HER, ハイ, 高品質, 非常に, 認定条件, しかしながら, 抱き合う顔, 人間, 人間の生活, if, 画像, インポート, 重要, in, 含む, 推論, 革新的手法, インストールを開始する, インストール, 機関, 指示する, 説明書, インテリジェンス, 興味がある, 無関係の, Is, IT, ITS, KDナゲット, KEEN, 神様です。, 知っています, 知識, 言語, 言語モデル, 大, 大規模な言語モデル, リーダー, 学習者, させて, ライセンス, 生活, ラマ, ラマ, LLM, 長寿, 探して, 探している, 機械, 作成, マネージャー, 大規模な, 手段, Meta, メタAI, , モデル, ヶ月, 他には？, もっと効率的, 最も, , マルチモーダル, ほぼ, 新製品, Next, Now, 夢中, of, on, かつて, ONE, の, 開いた, オープンソース, オープンソースソフトウェア, 業務執行統括, 最適化, or, その他, その他, でる, 優れたパフォーマンス, オーバー, 監督する, パッケージ, パラメータ, 部, 特に, のワークプ, パフォーマンス, 相, ピップ, パイプライン, プラトン, プラトンデータインテリジェンス, プラトデータ, 演劇, プレ, 予測する, 前, 印刷物, 問題, 処理, 作り出す, 進捗, 提供, 提供, 公共, 公開データ, 品質, ランク, 準備, 最近の, 最近, 減らします, リリース, リリース, 削除します, 反復的な, の提出が必要です, 必要, 研究, 研究者, 制限, 結果, 役割, 印税, ランニング, s, 安全な, 規模, 縮尺, 科学, 科学者, 科学者たち, セキュリティ, 見ること, を求める, 敏感な, 感情, シーケンス, カスタマーサービス, シェアリング, 彼女, 示す, 重要, 著しく, 同様の, 簡単な, サイズ, スキル, より小さい, So, ソフトウェア, 解決する, source, 調達, スタンディング, 開始, 強く, , そのような, 適した, 撮影, タスク, パッケージ種類, テク, 技術的, テクノロジー, テクノロジー, 技術革新, 十, test, 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다. , より, それ, 　, 未来, 公共, 世界, その後, 理論, ボーマン, 彼ら, 考える, この, 徹底的に, 数千, 介して, 時間, 〜へ, トークン, トークン, top, トピック, トーチ, トラック, 訓練を受けた, トレーニング, トレーニングデータ, 変形させる, トランスフォーマー, インタビュー, 1兆, true, 試します, チュートリアル, 2, UAE, ユニーク, ユナイテッド, アラブ首長国連邦, us, つかいます, 中古, 便利, , 検証済み, ve, バージョン, バーチャル, バーチャルアシスタント, 欲しいです, ました, 方法, we, ウェブ, 週間, WELL, 行ってきました, この試験は, 日時, コラボレー, どちら？, 一方で, 全体, 願い, 　, 以内, 仕事, 世界, 作家, 書き込み, ライティングスキル, You, ゼファーネット

エクスレラ8

Falcon LLM: オープンソース LLM の新たな王様 – KDnuggets

プラトン再発行

ファルコン 40B では何ができるのでしょうか?

Falcon 40B はどのように訓練されましたか?

このトピックの詳細

ランド・ノリスがハミルトンからF1中国GPのスプリントポールを奪取 – Autoblog

ビットコインのパイオニア、ハル・フィニー氏の死後、自身の名を冠した新たな賞を受賞

BitwiseのCIOは、市場は半減期後のビットコインの将来の需要を織り込んでいないと考えている

私たちとチャット