WEKO3
アイテム
Efficient Large Language Model Inference
https://doi.org/10.34413/dr.02118
https://doi.org/10.34413/dr.021185102c75a-fb71-40d5-b8b7-22edd9af812d
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
|
|
|
|
| アイテムタイプ | 学位論文(博士論文) / Thesis or Dissertation(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2026-03-12 | |||||||
| タイトル | ||||||||
| タイトル | Efficient Large Language Model Inference | |||||||
| 言語 | ||||||||
| 言語 | eng | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Large Language Models | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Inference Efficiency | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Long Context | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | KV Cache | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Model Compression | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Sparsity | |||||||
| 資源タイプ | ||||||||
| 資源タイプ | doctoral thesis | |||||||
| ID登録 | ||||||||
| ID登録 | 10.34413/dr.02118 | |||||||
| ID登録タイプ | JaLC | |||||||
| アクセス権 | ||||||||
| アクセス権 | open access | |||||||
| その他のタイトル | ||||||||
| その他のタイトル | 効率的な大規模言語モデル推論 | |||||||
| その他のタイトル | ||||||||
| その他のタイトル | コウリツ テキ ナ ダイキボ ゲンゴ モデル スイロン | |||||||
| 著者 |
Guo, Zhiyu
× Guo, Zhiyu
|
|||||||
| 書誌情報 |
発行日 2025-03-31 |
|||||||
| 出版者 | ||||||||
| 出版者 | Nara institute of Science and Technology | |||||||
| 出版タイプ | ||||||||
| 出版タイプ | VoR | |||||||
| 学位名 | ||||||||
| 学位名 | 博士(工学) | |||||||
| 学位授与機関名 | ||||||||
| 学位授与機関名 | 奈良先端科学技術大学院大学 | |||||||
| 学位授与年月日 | ||||||||
| 学位授与年月日 | 2025-03-31 | |||||||
| 学位授与番号 | ||||||||
| 学位授与番号 | 甲第2118号 | |||||||
| 電子化ID | ||||||||
| 値 | R019308 | |||||||
| 電子化ID | ||||||||
| 値 | R019252 | |||||||