ub-MOJI

日本語指文字のためのオープンデータセット

手話認識および系列モデリング研究のための、日本語指文字を対象とした時間アノテーション付きの公開動画データセット。

データセット詳細

このセクションでは、ub-MOJI データセットの構成(3 種類のサブセット・動画と注釈の形式・メタデータファイル・ファイル命名規則)について説明します。

注: 一部のサンプルは参加者同意の都合で非公開です。

サブセット
言語単位ごとに3種類のサブセットが整理されています。
サブセット単位保存形式注釈
syllables単独の仮名仮名ごとのサブディレクトリなし
sequences5文字の仮名列フラット構成.toml あり
words単語フラット構成.toml あり
動画と注釈
すべてのサンプルが RGB の mp4 動画で、sequences / words には時間注釈が付きます。
項目形式対象補足
動画.mp4 (RGB)全サブセットサンプルごと
annotations.toml.tomlsequences / wordsフレーム時刻
メタデータ
サンプル単位・参加者単位の CSV が提供されます。
ファイル単位代表項目
metadata.csvサンプルfile_name, classes, category, participant_id, recording_date, fps
participants.csv参加者participant_id, age_group, gender, dominant_hand, experience_years, hearing_level, face_visibility

未提供項目は -1 で表記されます。

ファイル命名規則
{content}_{participantID}_{yyyymm}_{take}.mp4
要素意味
content仮名 / 連続仮名 / 単語a, aiueo, kamakura
participantID参加者ID001
yyyymm年+月202403
takeテイク番号t001

ライセンス

利用には Hugging Face の規約への同意が必要です。個人識別・プライバシー侵害目的の使用は禁止され、論文等では適切に引用してください。

学術目的のみ商用不可再配布不可

著者

東京工芸大学 映像情報処理研究室

引用

論文またはデータセットを引用する際は、以下のBibTeXをご利用ください。

@InProceedings{Murai_2025_ICCV,
    author    = {Murai, Ryota and Tsuta, Naoto and Shin, Duk and Kang, Yousun},
    title     = {Point-Supervised Japanese Fingerspelling Localization via HR-Pro and Contrastive Learning},
    booktitle = {Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV) Workshops},
    month     = {October},
    year      = {2025},
    pages     = {4975-4982}
    doi       = {10.1109/ICCVW69036.2025.00516},
}