SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    谷歌

    共 256 篇文章
    排序
    发布更新浏览点赞
    谷歌Gemini CLI集成Zed编辑器:开发者可直接在IDE中生成代码、解析错误,减少上下文切换

    谷歌Gemini CLI集成Zed编辑器:开发者可直接在IDE中生成代码、解析错误,减少上下文切换

    开源代码编辑器Zed近日迎来重要更新——谷歌已将开源的Gemini CLI正式集成其中。依托Zed编辑器的Rust架构性能优势,开发者可在编辑器内直接调用Gemini模型,实现代码生成、重构、错误解释...
    早报# Gemini CLI# Zed编辑器# 谷歌
    4个月前
    02030
    Google Vids更新:AI化身功能正式上线,同步推出免费消费者版本

    Google Vids更新:AI化身功能正式上线,同步推出免费消费者版本

    去年面向Google Workspace生产力套件推出的视频编辑器Google Vids,近日迎来重要更新:不仅新增AI化身、自动转录修剪、图像到视频等实用功能,还首次推出免费的消费者版本。此次调整既...
    早报# Google Vids# 视频编辑器# 谷歌
    4个月前
    03230
    nano-banana正式版!谷歌发布全新图像模型Gemini 2.5 Flash Image,更精准的 AI 图像编辑

    nano-banana正式版!谷歌发布全新图像模型Gemini 2.5 Flash Image,更精准的 AI 图像编辑

    谷歌正在为其 Gemini 聊天机器人引入一项重要升级:全新的 AI 图像模型 Gemini 2.5 Flash Image。该模型不仅提升了图像生成质量,更在编辑精度、角色一致性与多图融合方面实现了...
    图像模型# AI 图像编辑# Gemini 2.5 Flash Image# nano-banana
    4个月前
    04370
    如何在 LMArena 稳定使用谷歌 nano banana 模型?

    如何在 LMArena 稳定使用谷歌 nano banana 模型?

    此前在大模型测试评估平台LMArena上现身的图像编辑模型nano banana,如今已确认归属谷歌——不过目前它仍处于测试阶段,仅能在LMArena内使用,且需通过“抽卡”方式获取使用资格,常需多轮...
    提示词# LMArena# nano-banana# 谷歌
    4个月前
    06890
    谷歌nano-banana模型落地在即:Flow将添文本转图像功能,同步优化创作者工作流

    谷歌nano-banana模型落地在即:Flow将添文本转图像功能,同步优化创作者工作流

    随着谷歌nano-banana模型的发布预期逐渐升温,其生态落地布局也在稳步推进——这款模型不仅计划集成到Gemini、Whisk等现有工具中,最新迹象显示,它还将登陆创意平台Flow,为其带来全新的...
    早报# nano-banana# 谷歌
    4个月前
    04570
    谷歌Gemini测试三大新模式:Agent支持自主任务,Go与Immersive View补全创意与视觉体验

    谷歌Gemini测试三大新模式:Agent支持自主任务,Go与Immersive View补全创意与视觉体验

    谷歌正持续扩展Gemini的功能边界——继此前曝光与“nano-banana模型”相关的“gem pix”图像编辑选项后,近期Gemini的模式选择器中又出现三项实验性新功能:Agent模式、Gemi...
    早报# Gemini# 谷歌
    4个月前
    01510
    谷歌发布新款Gemini教育工具:覆盖教、学全场景,免费开放且强化数据安全

    谷歌发布新款Gemini教育工具:覆盖教、学全场景,免费开放且强化数据安全

    在今年的国际教育技术学会(ISTE)大会上,谷歌针对教育场景推出全新人工智能解决方案,围绕“教育者提效”与“学生赋能”两大核心,升级Gemini系列工具,同时强化数据安全与责任管控,适配不同规模教育机...
    早报# Gemini教育工具# 谷歌
    4个月前
    01640
    谷歌Pixel 10推出Pixel Journal:设备端AI助写日记,支持情绪记录与隐私锁定

    谷歌Pixel 10推出Pixel Journal:设备端AI助写日记,支持情绪记录与隐私锁定

    在Pixel 10系列发布会上,谷歌正式推出全新日记应用 Pixel Journal,距离苹果2023年随iOS 17推出Journal应用约两年。这款应用以“设备端AI辅助创作”为核心,支持添加多维...
    早报# Pixel 10# Pixel Journal# 谷歌
    4个月前
    02560
    谷歌AI模式全球扩展:新增餐厅预订代理功能,支持个性化搜索

    谷歌AI模式全球扩展:新增餐厅预订代理功能,支持个性化搜索

    谷歌宣布对其“AI模式”进行两项核心升级:一是将该功能扩展至180个新国家(暂支持英语),此前仅覆盖美国、英国、印度;二是新增代理预订、个性化搜索及协作分享功能,进一步提升搜索的实用性与定制化体验。其...
    早报# AI模式# 谷歌
    4个月前
    02410
    Gemini Live升级:视觉指导+多应用联动,打造更自然的AI助手体验

    Gemini Live升级:视觉指导+多应用联动,打造更自然的AI助手体验

    谷歌持续推进“通用AI助手”愿景,对Gemini Live进行三大核心升级:新增摄像头实时视觉指导、深度整合更多Google应用、优化音频交互体验,让助手不仅能“听”和“说”,还能“看见并联动”,进一...
    早报# Gemini Live# 谷歌
    4个月前
    01700
    谷歌推Gemini for Home,家庭语音助手迈入AI 2.0时代

    谷歌推Gemini for Home,家庭语音助手迈入AI 2.0时代

    家,是人们情感连接、日常管理与身心放松的港湾。大约十年前,Google Assistant开启了家庭便捷语音助手的先河,让无数人体验到用语音轻松处理简单事务、快速获取答案的便捷。如今,谷歌又推出了新一...
    早报# Gemini for Home# 谷歌
    4个月前
    01230
    谷歌为 AI Studio 推出 GitHub 集成,强化开发者工作流

    谷歌为 AI Studio 推出 GitHub 集成,强化开发者工作流

    谷歌正持续加码其 AI 开发平台 AI Studio,近期一项未大张旗鼓发布的更新,悄然上线了 GitHub 集成功能。此举标志着 AI Studio 正从一个简单的提示词测试工具,向支持完整开发周期...
    早报# AI Studio# GitHub# 谷歌
    4个月前
    01920
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    MinerU

    MinerU

    MinerU是一款功能强大、操作简单的文档解析工具。它不仅支持多种格式和导入方式,还能精准提取复杂元素,适用于多种场景。无论是学术研究、数据分析还是日常办公,MinerU都能为你带来流畅、准确的解析体验。在科研、学习和工作中,处理复杂文档格式一直是一个让人头疼的问题。无论是科技文献中的公式、表格,还是多语言扫描版PDF,传统工具往往难以满足高效、精准的解析需求。而今天要介绍的 MinerU,正是一款专为解决这些问题而生的免费文档解析神器。它不仅能精准提取复杂元素,还支持多种格式一键转换,适用于从机器学习到大模型语料生产的多种场景。 全格式兼容,轻松导入 MinerU 的一大亮点是其强大的格式兼容性。无论你的文档是 PDF、Word、PPT 还是图片,MinerU 都能轻松应对。通过简单的拖拽、截图或批量上传,你就可以快速将文件导入工具中,无需繁琐的操作。 支持格式:PDF、Word、PPT、图片等主流文档类型。 操作便捷:拖拽、截图、批量上传,一键完成导入。 智能识别:自动检测扫描版PDF和乱码PDF,并启用OCR功能,支持84种语言的检测与识别。 复杂元素精准提取 对于科技文献、学术论文等包含复杂排版的文档,MinerU 表现尤为出色。它能够精准定位并提取图表、公式等复杂元素,确保内容完整且语义连贯。 精准定位:自动识别文档中的图表、公式、表格等复杂元素,并进行精准提取。 结构保留:输出结果保留原文档的标题、段落、列表等结构,确保逻辑清晰。 多模态解析:支持图像描述、表格标题、脚注等内容的提取,适配多种使用场景。 多场景极速输出 MinerU 不仅擅长解析文档,还提供了丰富的输出格式选择,满足不同场景的需求。无论是用于机器学习训练、大模型语料生产,还是构建 RAG(检索增强生成)系统,MinerU 都能提供高效的解决方案。 多种输出格式: Markdown:适合多模态与NLP任务。 JSON:按阅读顺序排序,便于后续处理。 LaTeX:自动识别并转换公式,极大提升科研效率。 HTML:自动转换表格,方便网页展示。 可视化支持:提供 layout 可视化、span 可视化等功能,便于高效确认输出效果与质检。 技术亮点与性能优化 MinerU 在技术层面同样表现出色,兼顾了易用性与性能优化: 跨平台支持:兼容 Windows、Linux 和 Mac 平台,满足不同用户的设备需求。 硬件加速:支持纯 CPU 环境运行,同时可选 GPU(CUDA)、NPU(CANN)、MPS 加速,显著提升处理速度。 高精度 OCR:针对扫描版PDF和乱码文档,MinerU 内置高精度OCR功能,支持84种语言的检测与识别。 主要功能一览 MinerU 的核心功能覆盖了文档解析的方方面面,帮助用户高效完成复杂的文档处理任务: 删除冗余元素:自动移除页眉、页脚、脚注、页码等内容,确保输出文本语义连贯。 阅读顺序优化:输出符合人类阅读习惯的文本,无论是单栏、多栏还是复杂排版都能轻松应对。 公式与表格转换: 自动识别并转换公式为 LaTeX 格式。 自动识别并转换表格为 HTML 格式。 多语言支持:OCR 功能支持84种语言,满足国际化需求。 灵活输出:支持多种格式输出(Markdown、JSON、LaTeX、HTML 等),适配多种应用场景。 适用场景广泛 MinerU 的设计初衷是为了服务于科研和技术发展,但它的应用范围远不止于此。以下是一些典型的应用场景: 机器学习与大模型训练:将大量文档转化为高质量的训练数据,助力模型语料生产。 RAG 系统构建:为检索增强生成系统提供结构化数据支持。 学术研究:快速解析科技文献,提取关键信息,提升科研效率。 企业办公:批量处理合同、报告等文档,节省人工整理时间。 为什么选择 MinerU? 相比其他文档解析工具,MinerU 的优势在于其全面性和精准性。它不仅能够处理各种复杂文档,还能根据用户需求输出多样化的结果。更重要的是,MinerU 完全免费,且持续优化以解决科技文献中的符号转化问题,为大模型时代的技术进步贡献力量。
    Claude Code 

    Claude Code 

    Claude Code 是一款代理编码工具,运行于您的终端,能够理解您的代码库,并通过自然语言命令帮助您更快地编码,执行日常任务,解释复杂代码,并处理 Git 工作流程。
    You.com

    You.com

    You.com是一家专注于AI搜索和研究的初创公司,以其先进的技术、对隐私的重视以及强大的企业级解决方案,在AI领域占据了一席之地。它的产品不仅为个人用户提供了更个性化的搜索体验,还为企业用户提供了高效的深度研究工具,融资和市场认可为其未来发展奠定了基础。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    查看完整榜单