提示工程--增加評分穩定性與正確性

 https://chatgpt.com/share/7b3b51b4-e5e1-4378-851c-8f9c5db0d6bb

在請 ChatGPT 擔任專家評分時,提升評分的穩定性與正確性可以從以下幾個方面進行 prompt engineering:


A. 明確指示與目標
清楚地定義評分標準和目標,確保 ChatGPT 知道評分的具體要求。

請根據以下標準評分:
1. 清晰度:語句是否清晰易懂。
2. 邏輯性:論點是否具有邏輯性和連貫性。
3. 詳盡性:內容是否充分、詳盡。

每個標準的評分範圍為1到5分,請分別給出每個標準的分數以及總分。


B. 提供參考範例
提供已評分的範例,讓 ChatGPT 了解預期的評分結果和方法。

以下是一個評分範例:
文本:'職能治療在康復過程中扮演重要角色。'
評分:
1. 清晰度:5分,語句簡明扼要。
2. 邏輯性:5分,論點明確且有依據。
3. 詳盡性:3分,缺乏具體實例支持。
總分:13分


C. 分段評分
將文本分段,對每段進行評分,然後總結總分。

請對以下三段文本分別進行評分:
第一段:...
第二段:...
第三段:...

然後給出每段的總分和綜合評價。


D. 問題引導
通過問答的方式引導 ChatGPT 進行詳細評估。

該文本是否在語句清晰度上達到標準?請給出1到5分的評分並解釋原因。
該文本的邏輯性如何?請給出1到5分的評分並解釋原因。
該文本是否詳盡?請給出1到5分的評分並解釋原因。


E. 錯誤檢查
引導 ChatGPT 檢查並修正潛在的錯誤,以提升評分的準確性。

請檢查並修正以下評分中的任何潛在錯誤。


F. 重複評分
讓 ChatGPT 多次評分同一文本,並比較結果以確保一致性。

請對以下文本進行三次評分,並給出每次評分結果。比較三次評分結果,並總結一致性。

G. 回饋調整
根據給定的回饋進行調整和改進,讓 ChatGPT 學習和改進評分過程。

根據之前的評分回饋,請重新評估以下文本。


透過這些方法,可以有效提升 ChatGPT 擔任專家評分時的穩定性和正確性。

在設計 prompt 時,建議將 E、F、7G的指示分開給予和執行,這樣可以更清楚地引導 ChatGPT 完成每個步驟,同時也能方便根據每一步驟的結果進行調整和改進。以下是如何分開指示的具體方法:

AA. 錯誤檢查(指示 E)
首先進行初次評分,然後引導 ChatGPT 檢查並修正潛在的錯誤。

請對以下文本進行評分,並給出清晰度、邏輯性和詳盡性的評分,每項從1到5分:
文本:'職能治療在康復過程中扮演重要角色。'
評分:
1. 清晰度:___分,原因:___
2. 邏輯性:___分,原因:___
3. 詳盡性:___分,原因:___
總分:___分

請檢查並修正以上評分中的任何潛在錯誤。

BB. 重複評分(指示 F)
在檢查錯誤後,進行多次評分以確保一致性。

請對以下文本再進行兩次評分,並給出每次評分結果:
文本:'職能治療在康復過程中扮演重要角色。'

第一次評分:
1. 清晰度:___分,原因:___
2. 邏輯性:___分,原因:___
3. 詳盡性:___分,原因:___
總分:___分

第二次評分:
1. 清晰度:___分,原因:___
2. 邏輯性:___分,原因:___
3. 詳盡性:___分,原因:___
總分:___分

第三次評分:
1. 清晰度:___分,原因:___
2. 邏輯性:___分,原因:___
3. 詳盡性:___分,原因:___
總分:___分

請比較三次評分結果,並總結一致性。


CC. 回饋調整(指示 G)
根據前兩步的結果,給出回饋並要求重新評估。

根據以下回饋,請重新評估以下文本:
回饋:清晰度評分偏低,請具體說明原因。
文本:'職能治療在康復過程中扮演重要角色。'

重新評分:
1. 清晰度:___分,原因:___
2. 邏輯性:___分,原因:___
3. 詳盡性:___分,原因:___
總分:___分
這樣分步進行,可以有效控制每一步的質量,確保最終評分結果的準確性和一致性。









留言

這個網誌中的熱門文章

以中文撰寫的論文,如何請 ChatGPT 翻譯成英文

提示工程-以 PEDro 量表為例

My GPTs 協助評析論文