配置说明

这是一份完整的配置文件说明，配置文件在sakuramedia-data/config/config.toml

如果你还没有把服务跑起来，建议先看“快速开始”。这页更适合已经完成第一次部署、准备继续理解系统行为的用户。

路径都要写容器内路径

只要配置项里出现“路径”，默认都应该写容器内看到的路径，而不是宿主机路径。

例如：

正确：/data/db/sakuramedia.db
正确：/mnt/volume1/media/sakuramedia
错误：/Users/xxx/...

配置总览

当前主要配置组有：

根级：enable_docs
[database]
[auth]
[media]
[metadata]（包含元数据代理）
[movie_info_translation]
[scheduler]
[downloads]
[media_import]
[logging]
[image_search]
[qdrant]

下面按顺序说明。

`enable_docs`

这个是根级配置，不在任何 section 里。

toml

enable_docs = false

作用：

控制是否开启 Swagger / ReDoc 文档页面

建议：

普通使用场景保持 false
只有你需要直接访问后端 API 文档时再改成 true

`[database]`

这一组决定 SakuraMedia 使用什么数据库，以及如何连接数据库。

toml

[database]
engine = "sqlite"
path = "/data/db/sakuramedia.db"
charset = "utf8mb4"
url = ""

字段说明：

字段	默认值	作用
`engine`	`sqlite`	数据库类型，支持 `sqlite`、`mysql`、`postgres`
`path`	`/data/db/sakuramedia.db`	SQLite 数据库文件路径，仅 `sqlite` 生效
`charset`	`utf8mb4`	MySQL 字符集，仅 `mysql` 生效
`url`	`""`	MySQL / PostgreSQL 连接串

`database.pragmas`

这是 SQLite 专用的附加配置。

toml

[database.pragmas]
foreign_keys = 1

当前默认只用了：

foreign_keys = 1 开启 SQLite 外键约束

数据库怎么选

建议：

临时试跑：sqlite
长期使用：postgres
已经有稳定的 MySQL 环境：mysql

不建议把 sqlite 作为正式长期方案，尤其是你准备长期积累数据时，更推荐 PostgreSQL。

示例：

SQLite：

toml

[database]
engine = "sqlite"
path = "/data/db/sakuramedia.db"
charset = "utf8mb4"
url = ""

MySQL：

toml

[database]
engine = "mysql"
path = "/data/db/sakuramedia.db"
charset = "utf8mb4"
url = "mysql://sakuramedia:change-me@mysql:3306/sakuramedia"

PostgreSQL：

toml

[database]
engine = "postgres"
path = "/data/db/sakuramedia.db"
charset = "utf8mb4"
url = "postgresql://sakuramedia:change-me@postgres:5432/sakuramedia"

`[auth]`

这一组负责默认登录账号、JWT 签名和 token 有效期。

toml

[auth]
username = "account"
password = "account"
secret_key = "replace-with-a-random-secret-key"
algorithm = "HS256"
access_token_expire_minutes = 43200
refresh_token_expire_minutes = 10080

字段说明：

字段	默认值	作用
`username`	`account`	默认登录用户名
`password`	`account`	默认登录密码
`algorithm`	`HS256`	JWT 签名算法
`access_token_expire_minutes`	`43200`	Access Token 过期时间，单位分钟
`refresh_token_expire_minutes`	`10080`	Refresh Token 过期时间，单位分钟

说明：

username 和 password 主要用于第一次登录
登录后建议在 app 里修改账号密码

`[media]`

这一组控制媒体识别、标签判断、缩略图生成等和本地媒体处理相关的行为。

toml

[media]
others_number_features = ["OFJE", "CJOB", "DVAJ", "REBD"]
collection_duration_threshold_minutes = 300
inner_sub_tags = ["中字", "中文", "字幕组", "-UC", "-C"]
blueray_tags = ["蓝光", "4K", "4k"]
uncensored_tags = ["流出", "uncensored", "無码", "無修正", "UC", "无码", "破解", "UNCENSORED", "-UC", "-U"]
uncensored_prefix = ["PT-", "S2M", "BT", "LAF", "SMD", "SMBD", "SM3D2DBD", "SKY-", "SKYHD", "CWP", "CWDV", "CWBD", "CW3D2DBD", "MKD", "MKBD", "MXBD", "MK3D2DBD", "MCB3DBD", "MCBD", "RHJ", "MMDV"]
allowed_min_video_file_size = 1073741824
import_image_root_path = "/data/cache/assets"
subtitle_root_path = "/data/cache/subtitles"
max_thumbnail_process_count = 4
media_clip_root_path = "/data/media-clips"
media_clip_max_duration_seconds = 900
media_clip_ffmpeg_timeout_seconds = 120

字段说明：

字段	作用
`others_number_features`	合集影片番号特征关键词
`collection_duration_threshold_minutes`	合集影片时长判定阈值（分钟），仅当影片时长严格大于该值时才按时长判定为合集
`inner_sub_tags`	识别“内嵌字幕”的标签关键词
`blueray_tags`	识别“蓝光 / 高清版本”的标签关键词
`uncensored_tags`	识别“无码资源”的标签关键词
`uncensored_prefix`	识别“无码资源”的番号前缀
`allowed_min_video_file_size`	允许导入的视频最小文件大小，单位字节。小于该值的文件会被判定为“文件太小”并跳过导入。默认 `1073741824`（= 1 GiB），即小于 1GB 的视频不会导入。常见换算：256MB = `268435456`、512MB = `536870912`、1GB = `1073741824`。若导入时提示“文件太小”，按需把该值调小即可。不建议设为 `0` 或调得过低：BT 种子常夹带大量垃圾小视频，阈值太低会把它们一并尝试导入，建议不要低于 256MB
`import_image_root_path`	导入时缓存图片的目录
`subtitle_root_path`	字幕目录，用于整理导入时从影片资源同级目录识别到的字幕文件
`max_thumbnail_process_count`	缩略图生成任务的最大并发数
`media_clip_root_path`	用户切片（ffmpeg 切出的独立 mp4）的存储目录；与来源媒体解耦，删除媒体不会删除切片文件，建议单独挂卷持久化
`media_clip_max_duration_seconds`	用户可圈选的切片最大时长（秒），仅约束圈选区间长度
`media_clip_ffmpeg_timeout_seconds`	单次 ffmpeg 切片的墙钟超时（秒），坏文件 / 慢挂载卡死时杀进程回收

建议：

这组配置第一次部署通常不要动
只有当你明确知道自己的资源命名、字幕规则或缩略图性能瓶颈时，再调整

`[metadata]`

这一组控制元数据抓取和 GFriends 头像相关行为。

toml

[metadata]
javdb_host = "jdforrepam.com"
javdb_username = ""
javdb_password = ""
proxy = ""
gfriends_filetree_url = "https://cdn.jsdelivr.net/gh/xinxin8816/gfriends/Filetree.json"
gfriends_cdn_base_url = "https://cdn.jsdelivr.net/gh/xinxin8816/gfriends"
gfriends_filetree_cache_path = "/data/cache/gfriends/gfriends-filetree.json"
gfriends_filetree_cache_ttl_hours = 168
import_metadata_max_workers = 3

字段说明：

字段	作用
`javdb_host`	JavDB API 域名，不带协议头
`javdb_username`	JavDB 账号，用于抓取需登录的 TOP250 榜单（全部 / 有码 / 无码 / FC2 / 各年度）；留空则不抓 TOP250
`javdb_password`	JavDB 账号密码，与 `javdb_username` 配套使用
`proxy`	DMM、MissAV 与 GFriends 共用的 HTTP 代理地址；JavDB 默认直连
`gfriends_filetree_url`	GFriends 文件树索引地址
`gfriends_cdn_base_url`	GFriends CDN 根地址
`gfriends_filetree_cache_path`	GFriends 文件树本地缓存路径
`gfriends_filetree_cache_ttl_hours`	文件树缓存有效期，单位小时
`import_metadata_max_workers`	导入本地影片时抓取元数据的并发线程数

建议：

大多数元数据抓取场景只需要配置 proxy
proxy 同时用于 DMM 描述抓取、MissAV 页面访问和 GFriends 头像资源访问，DMM 需要你自行分流到日本代理节点
javdb_host、GFriends 相关地址通常不建议随便改
javdb_username / javdb_password 是可选项，只在需要 JavDB TOP250 榜单时填写；两者都留空时 TOP250 不会被抓取，填错时会在通知中心收到一条登录失败提醒

`[movie_info_translation]`

这一组控制影片信息翻译任务连接的外部 OpenAI 兼容大模型接口。当前它由“影片简介翻译”和“影片标题翻译”共用。

toml

[movie_info_translation]
enabled = false
base_url = "https://ollama.com"
api_key = "填入ollama的api key"
model = "gemma4:31b-cloud"
timeout_seconds = 300
connect_timeout_seconds = 3

字段说明：

字段	作用
`enabled`	是否启用影片信息翻译任务
`base_url`	OpenAI 兼容大模型接口地址
`api_key`	大模型接口 API Key
`model`	翻译使用的模型名称
`timeout_seconds`	翻译请求总超时秒数
`connect_timeout_seconds`	翻译请求建连超时秒数

建议：

如果你暂时不需要中文简介和中文标题，可以保持 enabled = false
真正启用前，先用常用命令里的 test-trans 验证这个 OpenAI 格式接口是否可用
这组配置只影响影片信息翻译，不影响影片原文描述抓取
旧配置名 [movie_desc_translation] 目前仍兼容，但新配置建议统一写成 [movie_info_translation]
文档里的 base_url 示例当前统一写成 https://ollama.com，model 示例当前统一写成 gemma4:31b-cloud

`[scheduler]`

这一组控制后台定时任务是否开启，以及每个任务的运行频率。

toml

[scheduler]
enabled = true
log_dir = "/data/logs"
actor_subscription_sync_cron = "0 2 * * *"
subscribed_movie_auto_download_cron = "30 2 * * *"
download_task_sync_cron = "* * * * *"
download_task_auto_import_cron = "*/3 * * * *"
download_small_file_cleanup_cron = "*/5 * * * *"
movie_collection_sync_cron = "0 1 * * *"
movie_heat_cron = "15 0 * * *"
movie_interaction_sync_cron = "0 * * * *"
ranking_sync_cron = "45 1 * * *"
hot_review_sync_cron = "20 1 * * *"
media_file_scan_cron = "0 */6 * * *"
movie_desc_sync_cron = "0 4 * * *"
movie_desc_translation_cron = "15 4 * * *"
movie_title_translation_cron = "20 4 * * *"
media_thumbnail_cron = "*/5 * * * *"
image_search_index_cron = "0 0 * * *"
image_search_optimize_cron = "0 3 * * *"
movie_similarity_recompute_cron = "30 3 * * *"
moment_recommendation_generate_cron = "0 4 * * *"
daily_recommendation_generate_cron = "0 5 * * *"
activity_cleanup_cron = "30 5 * * *"
activity_event_retention_days = 1
activity_task_run_retention_per_key = 200
activity_notification_read_retention_days = 3

字段说明：

字段	作用
`enabled`	是否启用后台定时任务
`log_dir`	后台任务日志目录
`actor_subscription_sync_cron`	订阅女优影片同步频率
`subscribed_movie_auto_download_cron`	已订阅缺失影片自动下载频率
`download_task_sync_cron`	下载任务状态同步频率
`download_task_auto_import_cron`	已完成下载自动导入频率
`download_small_file_cleanup_cron`	下载小文件清理频率
`movie_collection_sync_cron`	合集影片同步频率
`movie_heat_cron`	影片热度重算频率
`movie_interaction_sync_cron`	影片互动数同步频率；当前默认每小时执行一次，但影片是否真正进入候选仍受分层刷新规则影响
`ranking_sync_cron`	排行榜同步频率
`hot_review_sync_cron`	JavDB 热评同步频率
`media_file_scan_cron`	媒体文件巡检频率
`movie_desc_sync_cron`	影片原文描述回填频率
`movie_desc_translation_cron`	影片中文简介翻译频率
`movie_title_translation_cron`	影片标题翻译频率
`media_thumbnail_cron`	缩略图生成频率
`image_search_index_cron`	图片搜索索引生成频率
`image_search_optimize_cron`	图片搜索索引优化频率
`movie_similarity_recompute_cron`	影片相似度离线重算频率
`moment_recommendation_generate_cron`	推荐时刻生成频率
`daily_recommendation_generate_cron`	每日推荐快照生成频率
`activity_cleanup_cron`	活动中心数据清理频率
`activity_event_retention_days`	活动事件保留天数
`activity_task_run_retention_per_key`	每个任务键保留的运行记录条数
`activity_notification_read_retention_days`	已读通知保留天数

这组配置已经单独拆成了后台任务页面。
如果你想看“每个任务具体在做什么、哪些最关键、默认多久跑一次”，建议直接去那一页。

`[downloads]`

这一组控制下载链路里的小文件清理行为。

toml

[downloads]
small_file_cleanup_threshold_mb = 256

字段说明：

字段	默认值	作用
`small_file_cleanup_threshold_mb`	`256`	下载任务里小于该体积（MB）的文件会被当作无效文件清理，配合 `[scheduler].download_small_file_cleanup_cron` 定时执行

`[media_import]`

这一组控制可视化导入历史媒体时，目录浏览允许进入的根目录白名单。

toml

[media_import]
browse_roots = ["/mnt"]

字段说明：

字段	默认值	作用
`browse_roots`	`["/mnt"]`	导入已有媒体时，目录浏览 API 能访问的根目录白名单。这也是为什么媒体目录必须挂到容器内的 `/mnt` 下——挂到其他位置，在导入界面里就看不到、也选不到

`[logging]`

这一组控制全局日志等级。

toml

[logging]
level = "INFO"

字段说明：

字段	默认值	作用
`level`	`INFO`	全局日志等级，支持 `DEBUG`、`INFO`、`WARNING`、`ERROR`、`CRITICAL`

建议：

平时保持 INFO
排查问题时再临时改成 DEBUG

`[image_search]`

这一组控制 JoyTag 推理服务连接、搜索会话和索引任务行为。

toml

[image_search]
inference_base_url = "http://joytag-infer:8001"
inference_timeout_seconds = 30
inference_connect_timeout_seconds = 3
inference_api_key = ""
inference_batch_size = 16
session_ttl_seconds = 600
default_page_size = 20
max_page_size = 100
search_scan_batch_size = 100
index_upsert_batch_size = 100
optimize_every_records = 5000
optimize_every_seconds = 1800
optimize_on_job_end = true

字段说明：

字段	作用
`inference_base_url`	JoyTag 推理服务地址
`inference_timeout_seconds`	推理服务总超时秒数
`inference_connect_timeout_seconds`	推理服务建连超时秒数
`inference_api_key`	推理服务 Bearer Token
`inference_batch_size`	索引任务调用远端推理时的批大小
`session_ttl_seconds`	搜索会话有效期
`default_page_size`	默认每页结果数
`max_page_size`	最大每页结果数
`search_scan_batch_size`	为凑满一页结果时的扫描批大小
`index_upsert_batch_size`	向 Qdrant 批量写入的条数
`optimize_every_records`	每处理多少条成功记录触发一次分段 optimize
`optimize_every_seconds`	距离上次 optimize 超过多少秒后触发一次分段 optimize
`optimize_on_job_end`	任务结束后是否再执行一次兜底 optimize

建议：

第一次部署最需要关注的是 inference_base_url
只有在你修改了 joytag-infer 服务名、地址或鉴权方式时，才需要改 inference_api_key
inference_batch_size、search_scan_batch_size、index_upsert_batch_size
optimize_every_records、optimize_every_seconds、optimize_on_job_end
这类批量参数和优化参数默认就够用，通常不建议用户手动修改

`[qdrant]`

这一组控制图片搜索向量库的连接信息，对应 compose 中部署的 Qdrant 服务。

toml

[qdrant]
url = "http://qdrant:6333"
api_key = ""

字段说明：

字段	作用
`url`	Qdrant HTTP API 地址；compose 部署时默认走容器内部服务名 `qdrant`
`api_key`	Qdrant API Key；未启用鉴权时留空

配置说明 ​

路径都要写容器内路径 ​

配置总览 ​

enable_docs ​

[database] ​

database.pragmas ​

数据库怎么选 ​

[auth] ​

[media] ​

[metadata] ​

[movie_info_translation] ​

[scheduler] ​

[downloads] ​

[media_import] ​

[logging] ​

[image_search] ​

[qdrant] ​

配置说明

路径都要写容器内路径

配置总览

`enable_docs`

`[database]`

`database.pragmas`

数据库怎么选

`[auth]`

`[media]`

`[metadata]`

`[movie_info_translation]`

`[scheduler]`

`[downloads]`

`[media_import]`

`[logging]`

`[image_search]`

`[qdrant]`