y39彩票-y39彩票
y39彩票2023-01-31 16:05

y39彩票

向善而生的AI助盲,让AI多一点,障碍少一点******

  有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。

  新契机:多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。

  一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。

  多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。

  大挑战:如何看到盲人“眼中”的千人千面

  AI助盲看似简单,但多模态算法依然面临重大挑战。

  多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。

  另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。

  另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。

  最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。

  多解法:浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。

  盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。

  真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。

东西问·中外对话 | “全球化”概念首倡者:“统一的西方”概念已经过时了******

  中新社柏林4月22日电 题:“全球化”概念首倡者:“统一的西方”概念已经过时了

  中新社记者 彭大伟

  马丁·阿尔布劳(Prof. Martin Albrow)是西方率先提出“全球化”概念的学者之一,从事社会学职业生涯长达半个多世纪。马丁·阿尔布劳获剑桥大学博士学位,他是英国社会科学院院士、英国社会学会荣誉副主席、全球中国学术院荣誉院长。阿尔布劳教授近年来的研究方向转向中国,已出版两本研究人类命运共同体的专著。

  中新社德国分社首席记者、中新网研究院副院长彭大伟近期与阿尔布劳教授进行了对话。阿尔布劳表示,人类无法回到新冠疫情前的世界,但全球范围内的科学家们围绕抗疫开展的大量合作本身就是一项全球性的进程,展现了全球化所取得的进展。

  阿尔布劳认为,西方理解中国抗疫需要理解中国社会秩序所具备的历史基础,以及中国的执政党从中国传统中所汲取的治理智慧;中国的治理模式下,中央对社会的管理更加深入,也更有效率,这也造就了疫情下中西方表现的巨大差别。

图为马丁·阿尔布劳著作。供图图为马丁·阿尔布劳著作。供图

  针对中国能否避免“修昔底德陷阱”,实现和平崛起的问题,阿尔布劳认为,我们不应总是执着于旧式的地缘政治视角,而是更多地关注人工智能等新技术的发展,并且从国际社会的角度共同携手治理,进行对话与沟通,以引导新出现的技术向善,并管控风险。

图为马丁·阿尔布劳 供图图为马丁·阿尔布劳 供图

  对话实录摘编如下:

  彭大伟:您认为新冠疫情对全球化的发展会造成怎样的影响?我们能否最终回到我们曾经熟悉的那个“疫情前的世界”?

  阿尔布劳:简单地说,我的回答是“不能”。我们无法重回疫情暴发前的那个世界,这是因为我们本来就无法回到过去。疫情让我们看到,全球范围内的科学家们合作研究病毒、开发疫苗、交流信息,这就是一项全球性的进程,展现了全球化所取得的进展——至少在科学技术等领域。当前全球化的推动力来自于一种强大的压力,这种压力指向如何更好地通过技术控制住疾病、气候变化和实现军备控制等等。

  彭大伟:我此前采访马丁·雅克先生时,他曾说,要想理解中国抗疫,西方最好去读一读孔子。西方是否应从中国的做法中获得借鉴?

  阿尔布劳:在某种程度上,是的。我将儒家伦理视作中国古老的文化传统中非常重要的一个方面。两者是密不可分的。另一方面,我认为与儒家相关的若干实践,尤其是强调读古书、通过教育提升社会地位等,至今仍对中国社会具有十分深刻影响的因素。西方不应忘记的一个事实是,中国共产党是建立在中国数千年的传统之上的。尤其是考虑到中国传统中关于一个人应当通过知识和教育提升自身社会地位的部分,中国共产党是一个推动教育运动的政党,与纯粹的经济因素相比,它更重视文化价值、伦理因素。

  西方理应理解中国传统中的这一关键思想。这意味着,当应对新冠大流行这样的灾难时,国家做的是去唤起社会价值中广泛的共识。中国的执政党从中国传统中汲取了治理智慧。在这一意义上,我赞同马丁·雅克所说,我们永远不应忘记中国社会秩序所具备的历史基础。

  我想补充的是,除了历史传统外,中国共产党还从中央层级提供了非常强有力的推动力。基于此,中国的中央政府对社会的管理更加深入,也更有效率,尤其是借助现代技术的帮助后,这方面的管理效率之高(与西方相比)就更加突出。甚至在帝制时代的中国,这样的社会管理都是无法实现的。因此在疫情下,中国的表现和西方就有了巨大的差别。

  彭大伟:您认为中国能真正实现和平崛起吗?

  阿尔布劳:美国学者亨廷顿提出的“文明冲突论”,其立论建立在不同文化之间的深层次差异之上。但我并不真正相信这一理论,这是因为我认为不同文化可以共存,而且以一种相对和平的方式共存,并相互交流。不同文化之间或许会出现争端,但这并不意味着文化的差异性导致它们无法共存,共存是可能的。另一方面,至于“修昔底德陷阱”这一概念,与其说关注文化领域的现实,不如说更侧重于战略领域的现实。“修昔底德陷阱”关注的是这样一种事实,即“如果在一个单一世界里,有两方争夺主导权。那么要想避免爆发冲突,对双方而言都将变得十分艰难”。与文明的冲突相比,我认为第二种情景对世界构成更加真实的风险和威胁。

  我并不认为我们未来一定会面临“修昔底德陷阱”。只要我们将精力集中在上述全球融合的领域,聚焦我们的共同之处,这就包括全球化的生活方式,一切能够将我们凝聚在一起的文化成果。我认为这将胜过那些持续希望向外扩张、挑动冲突的群体和组织的影响力。

资料图:中欧班列长安号跨里海、黑海班列首发。 西安国际港务区供图资料图:中欧班列长安号跨里海、黑海班列首发。 西安国际港务区供图

  我更加担忧的是,由于某些偶然事件所引发的冲突和争端,例如人工智能的崛起,或是新型武器的发展。这是因为它们很容易就会发展到全自动的水平。各国在争夺新型武器的过程中也会卷入争斗。这些都是真实存在的风险,全世界都应该关注到这一风险。换言之,最大的风险不是地缘战略问题,而是新技术带来的后果。

  彭大伟:假如真的要迎来“亚洲世纪”,西方已经准备好接受这样一个世纪了吗?西方会乐见亚洲成为世界中心吗?

  阿尔布劳:我们所谈论的这个“西方”,其影响力目前看上去覆盖了世界的绝大多数地方,但“西方”绝对是在通向一个更加碎片化的方向。“西方”不会像美国人所希望的那样被视作一个整体。的确,美国总统拜登正在试图构建某种意义上的“民主国家联盟”,而这种做法已经近乎可笑了,因为拜登基本上是在邀请所有“不喜欢中国的国家”加入其中,而并不计较这些国家到底持什么政策、拥有什么政体。

  我认为,“统一的西方”这样的概念已经过时了。从这个角度来看,中国的领导力如今在国际机制和国际组织中体现得淋漓尽致,中国正努力推动这些机制和组织聚焦于全球共同的目标,聚焦于务实的项目、为全世界树立榜样,正如中国在应对气候变化和发展太阳能发电等诸多领域所做的那样。

  中国不仅拥有作出重大决策所需的资源和政治体制,更能够迅速地作出决策、且将其付诸实施。这是中国相比世界其它国家所具有的一项比较优势。

资料图:一处光伏基地。孙睿 摄资料图:一处光伏基地。孙睿 摄

  彭大伟:您对中国推进实现共同富裕有何看法?

  阿尔布劳:中国过去半个世纪以来的案例十分引人入胜。50年前,中国几乎没有什么能够被称为“福利国家”的要素。而在过去50年间,中国在教育和医疗等方面的公共福利持续得到增长。这是实现共同富裕的重要一环。

  因此中国是具备实现共同富裕的要素的。中国人口数量众多,且十分勤劳。与此同时,中国的政府明白应该经常地引导富裕群体去帮助那些在经济生活中不够成功的人群。我们需要明白的是,仅通过勤劳是不足以创造财富的,还需要有竞争。在这一方面,中国政府表现出了极大的智慧,将竞争放在一个符合全体人民共同利益的水平上加以管理。

  彭大伟:过去十年,中国特色社会主义进入新时代。您对中国这十年的发展有何看法?最重要的进展是什么?

  阿尔布劳:过去十年最重要的特点之一是,中国共产党更加广泛地代表了道德、社会和伦理层面的价值,更好地代表了整个中华民族的社会意识(social conscience)。如果中国共产党能够更好地胜任这一角色,且这一角色越来越得到普遍的接受,正如近十年所发生的那样,那么(中国的)未来看上去是十分充满希望的。(完)

   编者按:访谈全文收录在阿尔布劳新著《中国与人类命运共同体:探讨共同的价值与目标》(伦敦:环球世纪出版社,2021年版),并在2022年伦敦国际书展面向全球推介。

中国网客户端

国家重点新闻网站,9语种权威发布

y39彩票地图