KnowledgeRank: Top Science & Tech Papers

Powered by Engineering Brain, Japan | What is PKV? | PKV Methodology | KnowledgeRank v4.0.0: PKV Trends of My Authored Papers Are Now Available on My Page

A Comparative Study of Reward Functions in Learning Prompt-Based Length Control of LLMs via GRPO

['Hayato FUJIKOSHI', 'Takeshi OKADOME'] / IEICE Transactions in Information and Systems / Vol. 109 / No. 5

0.0 / 5

0 件のレビュー

レビュー投稿、編集、削除にはログインが必要です。

新着順高評価順低評価順

評価の内訳

5

0%

4

0%

3

0%

2

0%

1

0%

ログインしてレビューを書く

まだレビューは投稿されていません。あなたが最初のレビューを書きませんか？

ログインしてレビューを書く