首頁 > 圖像

圖像

  • 真正實(shí)現(xiàn)一步文生圖,谷歌UFOGen極速采樣,生成高質(zhì)量圖像

    最近一年來,以 Stable Diffusion 為代表的一系列文生圖擴(kuò)散模型徹底改變了視覺創(chuàng)作領(lǐng)域。數(shù)不清的用戶通過擴(kuò)散模型產(chǎn)生的圖片提升生產(chǎn)力。但是,擴(kuò)散模型的生成速度是一個老生常談的問題。因?yàn)榻翟肽P鸵蕾囉诙嗖浇翟雭碇饾u將初始的高斯噪音變?yōu)閳D片,因此需要對網(wǎng)絡(luò)多次計(jì)算,導(dǎo)致生成速度很慢。

  • OpenAI將在ChatGPT推出新的語音和圖像功能

    9月25日,OpenAI在官網(wǎng)宣布,將在未來兩周內(nèi)面向Plus和企業(yè)用戶推出ChatGPT的語音和圖像功能。上述功能允許用戶進(jìn)行語音對話或向ChatGPT展示其正在談?wù)摰膬?nèi)容。語音功能將在iOS和Android平臺推出,圖像功能將登陸所有平臺。

  • ICDAR2021首屆文檔圖像與自然語言處理研討會征稿進(jìn)行時

    近日,百度聯(lián)合中科院自動化所、德國人工智能研究中心、紐約州立大學(xué)布法羅分校舉辦ICDAR 2021第一屆文檔圖像與自然語言處理研討會DIL2021 (Workshop on Document Image and Language),并誠邀相關(guān)領(lǐng)域的各專家學(xué)者投稿參會,投稿論文涵蓋語義模型OCR、文檔

  • 天億馬:我司目前儲備的人工智能技術(shù),主要包括自然語言處理、圖像識別、語音識別等

    有投資者在投資者互動平臺提問:請問貴公司的的多模態(tài)AI人工智能交互技術(shù)包括哪些?天億馬(301178.SZ)12月13日在投資者互動平臺表示,我司目前儲備的人工智能技術(shù),主要包括自然語言處理、圖像識別、語音識別等,其中語音識別技術(shù)主要應(yīng)用于自有產(chǎn)品的人機(jī)交互和語音識別領(lǐng)域。

  • 谷歌計(jì)劃在未來幾周恢復(fù)AI人物圖像生成功能

    谷歌負(fù)責(zé)人工智能的高管表示,該公司計(jì)劃在“未來幾周”恢復(fù)被暫停的AI人物圖像生成功能。谷歌DeepMind負(fù)責(zé)人Demis Hassabis周一在巴塞羅那舉行的世界移動通信大會上說:“我們希望在很短的時間內(nèi)重新上線?!?/p>

  • TMI2024|阿大、同濟(jì)等提出TraCoCo,用于3D醫(yī)學(xué)圖像半監(jiān)督分割

    編輯 | ScienceAI3D 醫(yī)學(xué)圖像分割方法已經(jīng)取得了成功,但它們對大量體素級標(biāo)注數(shù)據(jù)的依賴是一個需要解決的缺點(diǎn),因?yàn)楂@取這些標(biāo)注的成本很高。半監(jiān)督學(xué)習(xí)(SSL)通過使用大量未標(biāo)注數(shù)據(jù)和少量標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練,解決了這一問題。最成功的 SSL 方法基于一致性學(xué)習(xí),即通過最小化從擾動視圖中獲得

  • 研究稱:生成一張AI圖像所消耗能源相當(dāng)于給手機(jī)充滿電

    生成一張圖像使用強(qiáng)大的 AI 模型所消耗的能源相當(dāng)于給手機(jī)充滿電- 使用 AI 模型生成文本的能源消耗較低- 大型生成 AI 模型的使用比專門針對特定任務(wù)的小型模型更能耗站長之家12月1日 消息:根據(jù) AI 初創(chuàng)公司 Hugging Face 和卡內(nèi)基梅隆大學(xué)的研究人員進(jìn)行的一項(xiàng)新研究,

  • 一文探討可解釋深度學(xué)習(xí)技術(shù)在醫(yī)療圖像診斷中的應(yīng)用

    機(jī)器之心分析師網(wǎng)絡(luò)作者:仵冀穎編輯:Joni本文依托于綜述性文章,首先回顧了可解釋性方法的主要分類以及可解釋深度學(xué)習(xí)在醫(yī)療圖像診斷領(lǐng)域中應(yīng)用的主要方法。然后,結(jié)合三篇文章具體分析了可解釋深度學(xué)習(xí)模型在醫(yī)療圖像分析中的應(yīng)用。作為一種領(lǐng)先的人工智能方法,深度學(xué)習(xí)應(yīng)用于各種醫(yī)學(xué)診斷任務(wù)都是非常有效的,在某