ub-MOJI

日本語指文字のためのオープンデータセット

手話認識および系列モデリング研究のための、日本語指文字を対象とした時間アノテーション付きの公開動画データセット。

データセット詳細

このセクションでは、ub-MOJI データセットの構成（3 種類のサブセット・動画と注釈の形式・メタデータファイル・ファイル命名規則）について説明します。

注: 一部のサンプルは参加者同意の都合で非公開です。

サブセット

言語単位ごとに3種類のサブセットが整理されています。

サブセット	単位	保存形式	注釈
syllables	単独の仮名	仮名ごとのサブディレクトリ	なし
sequences	5文字の仮名列	フラット構成	.toml あり
words	単語	フラット構成	.toml あり

動画と注釈

すべてのサンプルが RGB の mp4 動画で、sequences / words には時間注釈が付きます。

項目	形式	対象	補足
動画	.mp4 (RGB)	全サブセット	サンプルごと
annotations.toml	.toml	sequences / words	フレーム時刻

メタデータ

サンプル単位・参加者単位の CSV が提供されます。

ファイル	単位	代表項目
metadata.csv	サンプル	file_name, classes, category, participant_id, recording_date, fps
participants.csv	参加者	participant_id, age_group, gender, dominant_hand, experience_years, hearing_level, face_visibility

未提供項目は -1 で表記されます。

ファイル命名規則

{content}_{participantID}_{yyyymm}_{take}.mp4

要素	意味	例
content	仮名 / 連続仮名 / 単語	a, aiueo, kamakura
participantID	参加者ID	001
yyyymm	年+月	202403
take	テイク番号	t001

ライセンス

利用には Hugging Face の規約への同意が必要です。個人識別・プライバシー侵害目的の使用は禁止され、論文等では適切に引用してください。

学術目的のみ商用不可再配布不可

著者

東京工芸大学映像情報処理研究室

引用

論文またはデータセットを引用する際は、以下のBibTeXをご利用ください。

@InProceedings{Murai_2025_ICCV,
    author    = {Murai, Ryota and Tsuta, Naoto and Shin, Duk and Kang, Yousun},
    title     = {Point-Supervised Japanese Fingerspelling Localization via HR-Pro and Contrastive Learning},
    booktitle = {Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV) Workshops},
    month     = {October},
    year      = {2025},
    pages     = {4975-4982}
    doi       = {10.1109/ICCVW69036.2025.00516},
}

@misc{ubmoji2025,
  title        = {ub-MOJI},
  author       = {Kondo, Tamon and Murai, Ryota and Tsuta, Naoto and Kang, Yousun},
  year         = {2025},
  url          = {https://huggingface.co/datasets/kanglabs/ub-MOJI},
  publisher    = {Hugging Face},
}