Patrick Kwon, Jaeseong You, Gyuhyeon Nam, Sungwoo Park, Gyeongsu Chae, MoneyBrain Inc.
KoDF הוא מאגר סרטוני DEEPFAKE שיצרו חוקרים מחברת מוצרי הבינה המלאכותית הקוריאנית 'MoneyBrain Inc'. המאגר מורכב כולו מסרטונים בעלי נושאים קוריאנים. במאגר 62,166 סרטוני מקור ו-175,776 סרטוני DEEPFAKE שנוצרו בשש דרכים שונות. המאגר מאפשר מחקר על תופעת ה-DEEPFAKE בצורה ממוקדת לאוכלוסיה מסוימת, ומפצה על חוסר הייצוג של אוכלוסיה אסייאתית במאגרי DEEPFAKE גדולים אחרים.
Abstract:
A variety of effective face-swap and face-reenactment methods have been publicized in recent years, democratizing the face synthesis technology to a great extent. Videos generated as such have come to be collectively called deepfakes with a negative connotation, for various social problems they have caused. Facing the emerging threat of deepfakes, we have built the Korean DeepFake Detection Dataset (KoDF), a large-scale collection of synthesized and real videos focused on Korean subjects. In this paper, we provide a detailed description of methods used to construct the dataset, experimentally show the discrepancy between the distributions of KoDF and existing deepfake detection datasets, and underline the importance of using multiple datasets for real-world generalization.