如何识别ai生成的视频

一、视觉层面的AI痕迹(技术识别)

特征说明如何检测
1. 画面局部不连贯(帧间抖动)扩散模型是逐帧生成,缺乏全局物理建模,物体形状/位置在相邻帧轻微变形播放慢速(0.25x)或逐帧翻看,观察手、脸、头发、背景物体的微小闪烁/变形
2. 手指/面部畸变CLIP引导的图像生成对手部、牙齿、眼睛建模差放大看手(常多指/少指/融合)、脸部表情僵硬、牙齿不齐
3. 文字渲染错误AI很难生成正确文字(尤其是中文)视频中出现标牌、书、屏幕 → 文字模糊、乱码、拼写错误
4. 光影不一致光源方向、强度、反射不统一观察多个物体的阴影方向是否矛盾
5. 背景与前景融合异常自动配图常“硬贴”,深度感错误人物与背景边缘生硬,或人物“浮”在背景上
6. 运动轨迹不自然缺少真实物理惯性物体移动路径突兀、速度不匀、没有预期加速度

二、内容逻辑层面的AI痕迹(语义识别)

特征说明如何检测
1. 画面与文本“似是而非”关键词命中,但细节错位文本说“老人坐在公园长椅上看书”,画面却是“年轻人站在操场拿书”
2. 叙事缺乏因果镜头切换无逻辑上一秒下雨,下一秒晴天无过渡;人突然换衣服
3. 重复动作/静态感扩散模型倾向生成“循环小动作”人物反复点头、眨眼、手微动,像“活照片”
4. 缺乏交互细节真实视频有微交互(风吹头发、手扶物体)AI视频中头发静止、衣服无褶皱反应

三、技术检测方法(可自动化)1. 频域分析(FFT / 高频噪声)

  • 真实视频:压缩噪声、自然纹理
  • AI视频:高频噪声模式异常(扩散模型残留的“网格状”或“云雾状”噪声)
  • 工具:用Python + OpenCV做FFT,观察频谱图是否有规则条带

python

import cv2
import numpy as np
import matplotlib.pyplot as plt

frame = cv2.imread("frame.jpg", 0)
f = np.fft.fft2(frame)
fshift = np.fft.shift(f)
magnitude = 20 * np.log(np.abs(fshift))

# AI视频常有“环形”或“网格”高频 artifact

2. CLIP语义一致性检测

  • 提取每帧图像,用CLIP计算图像-文本相似度
  • 真实视频:相似度波动小且高
  • AI视频:相似度高但分布异常(局部匹配,整体不连贯)

python

# 伪代码
for frame in video:
    sim = clip_similarity(frame, prompt)
    if sim < 0.6 or 剧烈波动: → 疑似AI

3. 光学流(Optical Flow)分析

  • 计算相邻帧像素运动向量
  • AI视频:运动场不连续,有“跳跃”或“噪声块”
  • 工具:RAFT、FlowNet2

4. 元数据与编码分析

  • 检查视频编码器:AI工具常输出固定码率、特定容器(如WebM/VP9)
  • 缺少相机EXIF、镜头畸变、传感器噪声

四、实用识别流程(人工+工具结合)

1. 慢放视频 → 看手、脸、文字、光影
2. 截帧放大 → 找手指畸变、文字乱码
3. 看运动 → 是否有物理惯性?风吹反应?
4. 对比文本 → 画面是否“只沾边”?
5. 用工具:
   - https://hive.moderation.com/ (AI内容检测API)
   - https://illuminarty.ai/ (免费检测)
   - 本地跑CLIP + 光学流脚本

五、当前最强AI视频也难逃的弱点(2025年)

模型仍存在的破绽
Sora / Runway Gen-3复杂交互(多人握手、物体传递)失败
Luma Dream Machine文字几乎全错
Pika 1.5背景穿模严重

只要不是电影级特效,99%的“文本+配图”视频都能被识破。


总结:识别口诀(5秒判断法)

“手乱、字花、光不对、动不真、意不准”

  • 手乱 → 手指畸形
  • 字花 → 文字模糊/错
  • 光不对 → 阴影矛盾
  • 动不真 → 物理假
  • 意不准 → 画面不贴文本

只要满足3条以上,基本可判定为 AI生成。

Langfuse 与 Agenta 的详细比较

Langfuse 和 Agenta 都是专注于 LLM(大型语言模型)应用的工具平台,但它们的核心定位略有不同。Langfuse 是一个开源的 LLM 可观测性(observability)平台,主要强调跟踪、调试和监控 LLM 应用及代理的运行时行为,帮助开发者快速识别问题并优化性能。Agenta 则是一个更全面的 LLMOps 平台,侧重于提示工程(prompt engineering)、评估和端到端应用构建,支持从开发到生产的完整生命周期管理。两者都支持自托管,并适用于构建 AI 应用的工程师和团队,但 Langfuse 更偏向于后端监控,而 Agenta 更注重前端实验和协作。以下是从多个维度进行的详细比较,基于官方文档和第三方评测。比较数据来源于 2025 年的最新信息。1. 核心功能比较两者都提供可观测性和评估,但 Agenta 在提示管理和协作上更强,Langfuse 在跟踪深度上更胜一筹。

维度LangfuseAgenta
跟踪与可观测性核心功能:自动捕获 LLM 应用的完整 traces(跟踪),支持嵌套调用链接、延迟/成本指标可视化。基于 OpenTelemetry,支持代理图(agent graphs)。 langfuse.com提供 traces 和调试工具,用于根因分析、边缘案例识别和金标准数据集 curation。监控使用量和质量。 agenta.ai
提示管理支持提示版本管理和实验,但非核心;通过 SDK 集成 OpenAI 等 wrapper。 langfuse.com强项:Prompt Registry 支持版本控制、输出跟踪、生产部署和回滚;Playground 允许跨场景比较 prompts 和模型。 agenta.ai
评估与实验Evals 功能用于构建评估数据集和失败分析;支持指标计算。 langfuse.com系统评估工具,从 UI 运行评估;洞察变化对输出质量的影响;支持非代码用户实验。 agenta.ai
其他独特功能用户活动时间线、LLM 代理集成(如 LlamaIndex);开源优先,自定义性强。 research.aimultiple.com团队协作优化、工作流简化;支持自定义 playground 和自托管。 deepchecks.com

2. 定价与部署模式Langfuse 更注重免费开源,自托管门槛低;Agenta 的定价更灵活,但入门门槛可能更高(来源间有轻微差异,可能因更新)。

维度LangfuseAgenta
免费/开源选项完全开源,自托管免费,无限数据和功能限制。 langfuse.com支持自托管(FAQ 确认),Hobby 计划免费。 f6s.com
云版定价– Core:免费(含 100k units/月,额外 $8/100k units)。 – Hobby/Team:$0-29/月。 – Production:使用量计费($49/月起)。 – Enterprise:自定义。 langfuse.com +1– Hobby:$0/月。 – Pro:$49/月。 – Enterprise:自定义(需求为基础)。 部分来源显示起步 $399/月,可能为团队版。 agenta.ai +1
计费单位基于 traces/units(输入/输出 token),卷积折扣。 langfuse.com基于使用量、团队规模和支持级别。 agenta.ai
试用/限制免费层支持小规模实验,无限自托管。 blog.promptlayer.com免费 Hobby 计划支持入门;企业版提供试用。 f6s.com

3. 目标受众与用例

  • Langfuse:适合独立开发者或工程团队,专注于 LLM 应用的调试和监控。用例包括:代理系统故障诊断、性能优化、构建 eval 数据集。特别适用于开源爱好者和自托管场景。 langfuse.com
  • Agenta:针对产品和工程团队,强调协作和快速迭代。用例包括:提示实验、团队提示部署、生产 LLM app 构建。适合非纯代码用户(如提示专家)参与。 aiagentsdirectory.com +1

4. 集成与生态

  • Langfuse:强集成支持,包括 OpenAI wrapper、LlamaIndex、Python/JS SDK;兼容 OpenTelemetry,便于与其他监控工具结合。 langfuse.com +1
  • Agenta:集成细节较少公开,但支持 LLM 库的提示注入;强调与现有工作流的兼容(如 GitHub、Slack 社区支持)。 agenta.ai

5. 优缺点与适用场景

  • Langfuse 的优势:开源免费门槛低,跟踪深度强,适合技术驱动的监控需求。缺点:提示管理和 UI 协作不如 Agenta 直观。 agenta.ai
  • Agenta 的优势:端到端 LLMOps 更完整,支持 UI 驱动的实验和团队协作,加速从原型到生产。缺点:定价可能更高,集成文档较少。 agenta.ai +1
  • 选择建议:
    • 如果您需要纯监控和调试,选择 Langfuse(尤其是自托管)。
    • 如果焦点是提示工程和团队开发,选择 Agenta。
    • 两者可互补:用 Langfuse 监控,用 Agenta 构建。 agenta.ai

总体而言,在 2025 年的 LLM 工具生态中,Langfuse 以开源可观测性领先,而 Agenta 在 LLMOps 完整性上更具竞争力。

by: Grok4

截至目前最好用的語音轉文字方案依然是aadnk/faster-whisper-webui

地址:https://huggingface.co/spaces/aadnk/faster-whisper-webui

對比了幾個更新一點的方案,有的增加了隊列和資源可視化,但是效率比較低,尤其是沒有優化顯存佔用,比如https://github.com/jhj0517/Whisper-WebUI,使用v3模型時需要25G顯存,我的3090還跑不起來了,而且並不支持詞級標註。

爲了更方便的使用aadnk/faster-whisper-webui,可以在其文件目錄中增加一個docker-compose.yml

services:
  faster-whisper:
    image: registry.gitlab.com/aadnk/whisper-webui:latest
    container_name: faster-whisper
    deploy:
      resources:
        reservations:
          devices:
            - capabilities: [gpu]
    ports:
      - "7001:7860"
    volumes:
      - ./cache/whisper:/root/.cache/whisper
      - ./cache/huggingface:/root/.cache/huggingface
    restart: on-failure:15
    environment:
      - HTTP_PROXY=http://192.168.1.200:16236
      - HTTPS_PROXY=http://192.168.1.200:16236
      - NO_PROXY=localhost,127.0.0.1,::1
    command: >
      app.py
      --whisper_implementation whisper
      --input_audio_max_duration -1
      --server_name 0.0.0.0
      --auto_parallel True
      --default_vad silero-vad
      --default_model_name large-v2

注意其中的large-v2也可以改爲large-v3,最新版已經支持。另外,HTTP_PROXY相關設置是爲了啓動時通過代理訪問gradio,否則會啓動失敗,通過environment來設置代理的方式比較靈活,不會影響其他docker容器,詳細情況參加我前面一篇博客。

用Caddy部署wordpress

年前把公司网站的服务器换到了caddy上,今天想写一篇博客,发现证书过期了,之前用了certbot但是配置自动任务还是比较麻烦的,尤其是用了docker。索性一起换掉。

docker-compose.yml中的配置如下:

  caddy:
    image: registry.cn-beijing.aliyuncs.com/futuremeng/caddy:1.1
    container_name: caddy
    restart: unless-stopped
    environment:
      - TZ=Asia/Shanghai
    volumes:
      - ./services/caddy/config:/config
      - ${DATA_DIR}/caddy:/data
      - ${SOURCE_DIR}:/www/:rw
      - ${LOGS_DIR}/caddy:/var/log/caddy
    ports:
      - "80:80"
      - "443:443"
    networks:
      - default

其中的env变量请自行脑补。

caddyfile:

https://WordPress.com {
        root * /www/WordPress
        php_fastcgi php80:9000 {
                trusted_proxies private_ranges
        }
        file_server
        encode gzip
        @disallowed {
                path /xmlrpc.php
                path *.sql
                path /wp-content/uploads/*.php
        }
        rewrite @disallowed '/index.php'
}

详情可见:

https://github.com/futuremeng/dnmp

Inkscape是一个免费开源的矢量图形编辑软件

Inkscape是什么?

Inkscape是一个免费开源的矢量图形编辑软件,它适用于GUN/Linux,Windows或MacOS X系统平台。Inkscape提供了一套丰富的功能,被广泛用于艺术和技术插图中,例如:卡通,剪贴画,logo,排版,图表和流程图。不同于像素图,Inkscape使用的是矢量图,因此并不会被固定的像素所限制的,从而可以得到无限尺度清晰的打印输出和渲染。Inkscape使用标准化的SVG格式作为其主要文件格式(许多应用都支持SVG格式,包括网页浏览器)。

Inkscape支持导入和导出多种文件格式,包括SVG,AI,EPS,PDF,PS和 PNG。它有着全面的功能简单的界面,支持多种语言并被设计为可扩展的;用户可以用附加组件定制自己的Inkscape的功能。

Inkscape项目有着不断增长的全球性用户社区。有许多学习资料 可以帮助你开始自己的创作。帮助和支持是由社区提供的,如果你想帮助Inkscape项目变得更好,这里有许多方式可以供你参与进来 。

Inkscape是Software Freedom Conservancy(一个 美国501(c)(3)非盈利组织)中的一员。在美国,对Inkscape的贡献可以免税。

谁创造了Inkscape?

Inkscape是由许多作者共同创造的,每个作者都保留自己的版权,这些作者们也同样地参与了Inkscape技术和项目目标的设定。此外,还有许多非编程类的贡献者,他们也是Inkscape项目的重要一部分。

如果你想提及Inkscape的创作者或组织,你可以分别用 “Inkscape的贡献者们”和”Inkscape项目” 来区分Inkscape项目和Inkscape软件。

https://inkscape.org/zh-hans/simplified-chinese-about/