國科大&首師大合作綜述,「白盒」張量網絡:增強量子機器學習的可解釋性和效率
深度機器學習在 AI 的各個領域取得了顯著的成功,但同時實現高可解釋性和高效率仍然是一個嚴峻的挑戰。張量網絡(Tensor Network,TN)是一種源自量子力學的成熟數學工具,在開發高效的「白盒」機器學習方案方面顯示出了其獨特的優勢。
深度機器學習在 AI 的各個領域取得了顯著的成功,但同時實現高可解釋性和高效率仍然是一個嚴峻的挑戰。張量網絡(Tensor Network,TN)是一種源自量子力學的成熟數學工具,在開發高效的「白盒」機器學習方案方面顯示出了其獨特的優勢。
AI張量是 TensorFlow中的基本數據類型,它表示一個多維數組,可以用來表示數學中的標量、向量、矩陣等概念。張量有以下幾個重要的屬性:形狀(shape):張量的維度和每個維度的大小,例如 [2, 3] 表示一個二維張量,有兩行三列。類型(dtype):張量的數據類型,例如 tf.int32,
字幕組雙語原文:深度學習基礎:張量運算英語原文:Tensor Operations — Basic Building Blocks of Deep Learning2012-至今:深度學習爆炸時代在2012年的Imagenet運動之后,深度學習取得了突飛猛進的發展。 深度學習現在已經成為我們日常生活
有研究者發現,李開復「零一萬物」公司的 Yi-34B 模型基本上采用了 LLaMA 的架構,只是重命名了兩個張量。對此,「零一萬物」給出了官方回應。前段時間,開源大模型領域迎來了一個新的模型 —— 上下文窗口大小突破 200k,能一次處理 40 萬漢字的「Yi」。
11月15日消息,AI大模型創業公司“零一萬物”正式公開回應了其Yi大模型涉嫌抄襲LLaMA事件,稱做法確實不妥,將會按照外界建議修改爭議張量(Tensor)名。零一萬物由創新工場董事長兼CEO李開復于今年創辦,并在本月初宣布推出Yi-34B和Yi-6B兩個開源大模型,號稱對學術研究完全開放,