tsuzumi-7b
tsuzumi-7b
Version: 2
NTT DataLast updated November 2024

モデル名 #Model Name

tsuzumi-7b

モデルの詳細 #Model Details

モデル開発者株式会社 NTTデータ
利用規約ダウンロードページ (「ライセンス規約」)
モデルの説明tsuzumiは、NTTが開発した軽量な大規模言語モデルです。日本語と英語の指示に対して従うように学習されています。モデルの特徴、主な用途等は利用ガイドラインを参照ください。利用ガイドのダウンロードページ (「tsuzumi on Azure MaaSユーザーガイド」)
モデル情報下記の表をご覧ください。
モデルのバリエーション現時点でバリエーションはありません。
モデル入力テキストのみが入力可能です。
モデル出力テキストのみが生成可能です。
モデルのアーキテクチャtsuzumiは、自己回帰型トランスフォーマーモデルです。教師ありファインチューニング(SFT)により応答学習を実施しています。
モデルの学習期間tsuzumiの学習期間は2024年8月までであり、2024年5月までの知識を用いて学習されています。

モデル情報表 #Model Information Table

名前トレーニングデータパラメータ数内容の長さGQAトークン数
tsuzumi-7bオンライン公開データと非公開データ7B8k1.4T

トレーニングデータ #Training Data

Data Freshness事前学習データは2024年5月までに収集された情報により構成されています。

評価結果 #Evaluation Results

このセクションでは、tsuzumiモデルの日本語ベンチマークにおける結果を報告します。
ModelSizeJapanese MT-bench; turn1※ 日本語 / 英語
writingstemhumanitiesroleplayextractioncodingmathreasoning
tsuzumi-7B7B8.6 / 8.27.6 / 7.18.45 / 8.26.3 / 6.055.6 / 2.92.3 / 2.21.1 / 1.12.1 / 4.3
https://github.com/Stability-AI/FastChat/tree/jp-stable/fastchat/llm_judge  ※1ターンでの評価を採用

入出力例(リアルタイム推論用)#Sample inputs and outputs (for real-time inference)

設定可能なパラメータ #Supported Parameters 基本パラメータ: #Basic parameters:
名前デフォルト説明
temperature0.15モデルのランダム性を制御します。低い値でモデルがより決定的な、高い値でモデルがよりランダムな出力を返すようになります。
max_tokens4096生成するトークンの最大数です。
top_p1.0出力をサンプリングする際に考慮する出力候補を絞り込むための累積確率です。
frequency_penalty0.0新しいトークンがこれまでのテキストで存在する頻度に基づきペナルティを与え、同じトークンを繰り返す可能性を抑制します。
logit_biasnullモデル出力における特定のトークンの出現確率を変更します。
logprobsfalse出力トークンの対数確率を返すかどうかを指定します。
top_logprobs0各トークン位置で出力候補となったトークンを複数確認したい場合に、トークン数を指定します。上位から順に、各トークンの対数確率とともに返却します。
n1生成される応答のバリエーションの数です。
presence_penalty0.0これまでのテキストに基づいてトークンにペナルティを与え、新しいトピックについて話す可能性を高めます。
stopnull推論を停止するトークン指定です。
streamfalse応答を少しずつ出力するかどうかを指定します。
高度なパラメータ #Advanced Parameters – 指定する場合はHTTPリクエストヘッダーに“extra-params: allow”を設定してください:
名前デフォルト説明
min_tokens0生成するトークンの最小数です。
top_k-1 (フィルタなし)出力をサンプリングする際に考慮するトークンの個数です。
repetition_penalty1.0繰り返しフレーズに対するペナルティの重みです。高い値ほど類似したフレーズの繰り返しを抑制します。
length_penalty1.0出力長に基づいてシーケンスに与えるペナルティを設定します。

入力サンプル #Sample Input

{
  "input_data": {
    "input_string": [
      {
        "role": "user",
        "content": "Linuxの特徴を教えてください。"
      },
      {
        "role": "assistant",
        "content": "LinuxはオープンソースのUnixライクなオペレーティングシステムであり、多くのフリーソフトウェアとオープンソースプロジェクトをサポートしています。その特徴には以下が挙げられます:\n\n1. カスタマイズ性: LInuxはユーザーによるプログラムや設定ファイルの追加によって様々な方法でカスタマイズできます。これにより個人または特定のニーズに合わせたOS環境を構築することが可能です。\n\n2. セキュリティ: Linuxカーネルは頻繁にアップデートされるため、最新のセキュリティパッチとウイルス対策機 能を備えており、高い安全性を維持します。\n\n3. 移植性: Linuxはさまざまなハードウェアプラットフォーム(サーバ、デスクトップ、タブレットなど)上で動作し、それぞれ異な るアーキテクチャの特性にも対応できるように設計されています。\n\n4. コミュニティ: Linuxは広範な開発者およびユーザーネットワークから成る大規模かつ活発なコミュニティ を持っています。これらのメンバーは新しいアプリケーションやドライバーを開発・保守したり、問題を解決したり、新技術について議論しあったりします。"
      },
      {
        "role": "user",
        "content": "より詳細にお願いします。"
      }
    ],
    "parameters": {
      "temperature": 0.7,
      "top_p": 0.9
    }
  }
}

出力サンプル #Sample Output

{
  "output": "Linuxは多くのオープンソースプロジェクトの集合体であり、これらが組み合わさることでより高度な機能を持つ強力なオペレーティングシステムとなります。\n\n1. カスタマイズ性: Linuxカーネルには大量の設定可能なパラメータとオプションが含まれており、ユーザーによるプログラムや設定ファイルの追加によってさまざまな方法で システムを変更できます。これにより、特定のニーズに合わせたOS環境を構築することが可能です。\n\n2. セキュリティ: Linuxカーネル自体も頻繁にアップデートされますので、 その中で提供されている最新のセキュリティパッチとウイルス対策ツールを利用して安全性を確保します。このように常に新しい脅威から保護されます。\n\n3. 移植性: Linuxは異 なるハードウェアプラットフォーム上でも動作し、それぞれの構造的特徴に対応できるよう設計されています。これにより、デスクトップコンピュータだけでなく、ノートPCやタブ レットなどの他のデバイスにも柔軟かつ効率的にインストール・実行することができます。\n\n4. コミュニティ: Linux OS開発者およびユーザーネットワーク内では活発な議論がなされ、問題解決や新技術についての情報共有が行われます。また、バグ修正や新機能の開発など、継続的なサポートと改善活動も行っています。"
}
Descriptions in English

Model Name

tsuzumi-7b

Model Details

Model Developer NameNTT DATA
Terms of UseDownload (「ライセンス規約」)
Model Descriptiontsuzumi is a lightweight large language model developed by NTT, designed to handle both Japanese and English with high efficiency. Please refer to the User Guide for model features.Link to Download page (「tsuzumi on Azure MaaSユーザーガイド」)
Model InformationSee below table
Model VariationsNo variations for the moment
Model InputModels input text only.
Model OutputModels generate text only.
Model Architecturetsuzumi is an auto-regressive language optimized transformer. The tuned versions use supervised fine-tuning (SFT).
Model Datestsuzumi was trained until 2024/08; Knowledge cutoff is 2024/05.

Model Information Table

NameTraining DataParamsContent LengthGQATokens
Tsuzumi-7bA mix of publicly available online and private data7B8k1.4T

Training Data

Data FreshnessThe pretraining data has a cutoff of May 2024.

Evaluation Results

In this section, we report the results for the tsuzumi models on Japanese standard benchmarks.
ModelSizeJapanese MT-bench; turn1※ Japanese / English
writingstemhumanitiesroleplayextractioncodingmathreasoning
tsuzumi-7B7B8.6 / 8.27.6 / 7.18.45 / 8.26.3 / 6.055.6 / 2.92.3 / 2.21.1 / 1.12.1 / 4.3
 ※Evaluated in 1 turn only

Sample inputs and outputs (for real-time inference)

Supported Parameters # Basic parameters:
nameDefaults toExplanation
temperature0.15Controls randomness in the model. Lower values will make the model more deterministic and higher values will make the model more random.
max_tokens4096The maximum number of tokens to generate.
top_p1.0The cumulative probability of parameter highest probability vocabulary tokens to keep for nucleus sampling.
frequency_penalty0.0Positive values penalize new tokens based on their existing frequency in the text so far, decreasing the model's likelihood to repeat the same line verbatim.
logit_biasnullModify the likelihood of specified tokens appearing in the completion.
logprobsfalseWhether to return log probabilities of the output tokens or not.
top_logprobs0An integer between 0 and 20 specifying the number of most likely tokens to return at each token position, each with an associated log probability.
n1The number of generated response variations.
presence_penalty0.0Positive values penalize new tokens based on whether they appear in the text so far, increasing the model's likelihood to talk about new topics.
stopnullSpecification for stop words.
streamfalseWhether response is returned in partial message deltas.
# Advanced Parameters – To specify, set “extra-params: allow” in your HTTP request header:
nameDefaults toexplanation
min_tokens0The minimum number of tokens to generate.
top_k-1 (no filter)The number of highest probability vocabulary tokens to keep for top-k-filtering.
repetition_penalty1.0The weight of penalty for repeated phrases. Higher values will suppress repeating similar phrases.
length_penalty1.0Penalizes sequences based on their length.

Sample Input

{
  "input_data": {
    "input_string": [
      {
        "role": "user",
        "content": "Linuxの特徴を教えてください。"
      },
      {
        "role": "assistant",
        "content": "LinuxはオープンソースのUnixライクなオペレーティングシステムであり、多くのフリーソフトウェアとオープンソースプロジェクトをサポートしています。その特徴には以下が挙げられます:\n\n1. カスタマイズ性: LInuxはユーザーによるプログラムや設定ファイルの追加によって様々な方法でカスタマイズできます。これにより個人または特定のニーズに合わせたOS環境を構築することが可能です。\n\n2. セキュリティ: Linuxカーネルは頻繁にアップデートされるため、最新のセキュリティパッチとウイルス対策機 能を備えており、高い安全性を維持します。\n\n3. 移植性: Linuxはさまざまなハードウェアプラットフォーム(サーバ、デスクトップ、タブレットなど)上で動作し、それぞれ異な るアーキテクチャの特性にも対応できるように設計されています。\n\n4. コミュニティ: Linuxは広範な開発者およびユーザーネットワークから成る大規模かつ活発なコミュニティ を持っています。これらのメンバーは新しいアプリケーションやドライバーを開発・保守したり、問題を解決したり、新技術について議論しあったりします。"
      },
      {
        "role": "user",
        "content": "より詳細にお願いします。"
      }
    ],
    "parameters": {
      "temperature": 0.7,
      "top_p": 0.9
    }
  }
}

Sample Output

{
  "output": "Linuxは多くのオープンソースプロジェクトの集合体であり、これらが組み合わさることでより高度な機能を持つ強力なオペレーティングシステムとなります。\n\n1. カスタマイズ性: Linuxカーネルには大量の設定可能なパラメータとオプションが含まれており、ユーザーによるプログラムや設定ファイルの追加によってさまざまな方法で システムを変更できます。これにより、特定のニーズに合わせたOS環境を構築することが可能です。\n\n2. セキュリティ: Linuxカーネル自体も頻繁にアップデートされますので、 その中で提供されている最新のセキュリティパッチとウイルス対策ツールを利用して安全性を確保します。このように常に新しい脅威から保護されます。\n\n3. 移植性: Linuxは異 なるハードウェアプラットフォーム上でも動作し、それぞれの構造的特徴に対応できるよう設計されています。これにより、デスクトップコンピュータだけでなく、ノートPCやタブ レットなどの他のデバイスにも柔軟かつ効率的にインストール・実行することができます。\n\n4. コミュニティ: Linux OS開発者およびユーザーネットワーク内では活発な議論がなされ、問題解決や新技術についての情報共有が行われます。また、バグ修正や新機能の開発など、継続的なサポートと改善活動も行っています。"
}
Model Specifications
Last UpdatedNovember 2024
Input TypeText
Output TypeText
PublisherNTT Data
Languages2 Languages