提示工程--增加評分穩定性與正確性

6月 03, 2024

https://chatgpt.com/share/7b3b51b4-e5e1-4378-851c-8f9c5db0d6bb

在請 ChatGPT 擔任專家評分時，提升評分的穩定性與正確性可以從以下幾個方面進行 prompt engineering：

A. 明確指示與目標

清楚地定義評分標準和目標，確保 ChatGPT 知道評分的具體要求。

請根據以下標準評分：

1. 清晰度：語句是否清晰易懂。

2. 邏輯性：論點是否具有邏輯性和連貫性。

3. 詳盡性：內容是否充分、詳盡。

每個標準的評分範圍為1到5分，請分別給出每個標準的分數以及總分。

B. 提供參考範例

提供已評分的範例，讓 ChatGPT 了解預期的評分結果和方法。

以下是一個評分範例：

文本：'職能治療在康復過程中扮演重要角色。'

評分：

1. 清晰度：5分，語句簡明扼要。

2. 邏輯性：5分，論點明確且有依據。

3. 詳盡性：3分，缺乏具體實例支持。

總分：13分

C. 分段評分

將文本分段，對每段進行評分，然後總結總分。

請對以下三段文本分別進行評分：

第一段：...

第二段：...

第三段：...

然後給出每段的總分和綜合評價。

D. 問題引導

通過問答的方式引導 ChatGPT 進行詳細評估。

該文本是否在語句清晰度上達到標準？請給出1到5分的評分並解釋原因。

該文本的邏輯性如何？請給出1到5分的評分並解釋原因。

該文本是否詳盡？請給出1到5分的評分並解釋原因。

E. 錯誤檢查

引導 ChatGPT 檢查並修正潛在的錯誤，以提升評分的準確性。

請檢查並修正以下評分中的任何潛在錯誤。

F. 重複評分

讓 ChatGPT 多次評分同一文本，並比較結果以確保一致性。

請對以下文本進行三次評分，並給出每次評分結果。比較三次評分結果，並總結一致性。

G. 回饋調整

根據給定的回饋進行調整和改進，讓 ChatGPT 學習和改進評分過程。

根據之前的評分回饋，請重新評估以下文本。

透過這些方法，可以有效提升 ChatGPT 擔任專家評分時的穩定性和正確性。

在設計 prompt 時，建議將 E、F、7G的指示分開給予和執行，這樣可以更清楚地引導 ChatGPT 完成每個步驟，同時也能方便根據每一步驟的結果進行調整和改進。以下是如何分開指示的具體方法：

AA. 錯誤檢查（指示 E）

首先進行初次評分，然後引導 ChatGPT 檢查並修正潛在的錯誤。

請對以下文本進行評分，並給出清晰度、邏輯性和詳盡性的評分，每項從1到5分：

文本：'職能治療在康復過程中扮演重要角色。'

評分：

1. 清晰度：___分，原因：___

2. 邏輯性：___分，原因：___

3. 詳盡性：___分，原因：___

總分：___分

請檢查並修正以上評分中的任何潛在錯誤。

BB. 重複評分（指示 F）

在檢查錯誤後，進行多次評分以確保一致性。

請對以下文本再進行兩次評分，並給出每次評分結果：

文本：'職能治療在康復過程中扮演重要角色。'

第一次評分：

1. 清晰度：___分，原因：___

2. 邏輯性：___分，原因：___

3. 詳盡性：___分，原因：___

總分：___分

第二次評分：

1. 清晰度：___分，原因：___

2. 邏輯性：___分，原因：___

3. 詳盡性：___分，原因：___

總分：___分

第三次評分：

1. 清晰度：___分，原因：___

2. 邏輯性：___分，原因：___

3. 詳盡性：___分，原因：___

總分：___分

請比較三次評分結果，並總結一致性。

CC. 回饋調整（指示 G）

根據前兩步的結果，給出回饋並要求重新評估。

根據以下回饋，請重新評估以下文本：

回饋：清晰度評分偏低，請具體說明原因。

文本：'職能治療在康復過程中扮演重要角色。'

重新評分：

1. 清晰度：___分，原因：___

2. 邏輯性：___分，原因：___

3. 詳盡性：___分，原因：___

總分：___分

這樣分步進行，可以有效控制每一步的質量，確保最終評分結果的準確性和一致性。

搜尋此網誌

ChatGPT使用經驗交流--謝老師評估工具研究室

提示工程--增加評分穩定性與正確性

留言

張貼留言

這個網誌中的熱門文章

如何請 ChatGPT 協助修改英文稿件

文獻檢索：學習相關知識&應用提示

ChatGPT協助閱讀論文 -- 問她 what, how 或 why 問題的問法與特質