隱私保護與醫學數據標準化競賽:解碼臨床病例、讓數據說故事 Forum

Go back to competition Back to thread list Post in this thread

> 有關task2的時間正規化問題

主辦你好,我們組別有一些關於task2的時間正規化問題想和你們請教:

問題1:
在ID: file2740的檔案中,資料格式為2019-06-30 00:00:00
我們組認為的正確答案是2019-06-30T00:00
但label卻多出了秒的格式2019-06-30T00:00:00
所以在時間的label上,我們需要額外加上秒的格式嗎?
以下是相關的例子:
ID: file14653, 21/09/2016 9:49:00 AM,
ID: file12740, 2019-06-30 00:00:00,
ID: file1291, 2818-09-14 00:00:00,
ID: file13206, 2019-02-24 00:00:00,
ID: file13536, 2020-05-30 00:00:00,
ID: file20986, 2020-04-02 00:00:00,
ID: file21189, 2019-06-12 00:00:00,
ID: file21392, 2020-05-27 00:00:00,

問題2:
如果資料只有時間,如在ID: file3489 及 ID: file611的檔案中, 資料為3.35 pm
我們組認為正確的label應為:T15:35
但卻是15:35
請問我們應該加上T還是移除T呢?

問題3:
舉例來說:
在ID: 1014的檔案中,資料為1310Hrs
我們可以正規化為T13:10 或 13:10
但label卻是2014-03-20T13:10
最後我們可以從文章中發現:
"F/S : Result for specimens A-C given to anaesthetist by Dr. Dick at 10:10hrs on 20/3/14. Result for specimen D&E given by phone to Prof. Lastrape at 1155Hrs. Result for specimen F given by phone to Prof. Badeau at 1310Hrs."
所以我們可以更正我們的演算法去做這個時間的正規化

但在更正之後,
在處理另一個ID:682的檔案時卻出現問題,
我們的演算法同時找到PM12:00跟5/2/2063的資訊,所以輸出label為2063-02-05T12:00
但此時label卻顯示doesn’t exist
請問此種狀況,該如何處理呢?

Posted by: Xiuyu223 @ Nov. 28, 2023, 3:16 p.m.

同學您好,

很高興您的提問,以上問題由我為您解答。

問題1:所以在時間的label上,我們需要額外加上秒的格式嗎?
答1:我們在做正規化時,都是以文本的內容為主,所以若文本內有提到秒的單位時,我們才會在正規畫時補上。(因為極少病理報告會記錄到這麼詳細的時間)

問題2:如在ID: file3489 及 ID: file611的檔案中, 資料為3.35 pm,我們組認為正確的label應為:T15:35
答2:您的判斷是對的,我們也有在更正版本上進行修正,再麻煩您重新下載,謝謝。

問題3:但此時label卻顯示doesn’t exist 請問此種狀況,該如何處理呢?
答3:您的判斷是對的,時間的正規化是會參考上下文的內容,您提出的問題我們也有在更正版本上進行修正,再麻煩您重新下載,謝謝。

希望您的問題能幫助到其他的參賽者,謝謝您。

Posted by: islab_ace @ Dec. 1, 2023, 4:32 a.m.
Post in this thread