库问搜索为什么用不了(库问搜索官网)
大家好!今天让创意岭的小编来大家介绍下关于库问搜索为什么用不了的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端
本文目录:
一、腾讯算法高级研究员陈松坚:智能问答技术及其应用
随着人工智能的飞速发展以及广泛落地应用,越来越多的设备将会被植入智能问答技术,人机交互场景随处可见,智能问答在未来将会成为一个非常重要的入口。
腾讯小知凭借着业界领先的智能AI引擎算法和海量大数据仓库,已将智能问答技术落地实施,并且经过大量的业务考验和优化,知识点匹配度和准确率都已达到90%以上,在2018 年 GITC 全球互联网技术大会上,腾讯小知荣获年度互联网最具价值产品奖。
腾讯小知算法负责人陈松坚也在会场发表了关于智能问答技术原理及其在To B场景下的应用的专题演讲,从自己的角度为我们展现智能问答技术的最新成果。
他首先从智能问答是什么,为什么和怎么做的三个问题出发,阐明了他对当前智能问答技术的定位和价值,首先,现阶段的智能问答是信息检索技术的升级,是量变而未达到质变。但是无论在To B还是To C的场景下,当前的技术都能够切实解决一些用户的痛点,提升用户体验,是亟待推进和充满想象的方向。
在回答怎么做这个问题时,他详细介绍了几种不同的问答机器人的实现路径,包括单轮问答机器人,多轮问答机器人及阅读理解机器人。其中重点阐述了单轮问答机器人的实现原理,包括字面匹配,词向量匹配,深度语义匹配,迁移学习等技术。
此后他还分享了小知团队将上述技术产品化的经验,包括智能客服机器人和电话机器人两大块,主要分享了当前产品的形态,亮点和实际项目中取得的一些成果。
最后,他简单总结了小知目前完成的工作以及就智能问答的发展提出了自己的几点看法。
--------------------------------------------------------------
以下是演讲稿全文:
各位下午好,很高兴今天能在这里给大家做分享报告。先介绍一下,我们腾讯小知是致力于为政府和各行业提供一揽子智能问答解决方案的团队,目前已经落地的包括基于文本的智能客服机器人和基于语音的电话机器人等。
在大多数人的认知里,智能问答很可能是以上的3个印象,2011年打败了人类取得问答竞赛冠军的waston;2017年被沙特授予公民身份的机器人sofia;更为大家熟知的钢铁侠中的机器人管家jarvis。在大家心目中,智能就意味着能够像真人一样交流。然而作为从业者,很遗憾地告诉大家,目前的技术还远没有达到这个目标,我认为本质上目前的智能问答技术是对信息检索技术的一次升级,是量变而未到质变。这个皇冠上的明珠还等待我们去摘取。
既然问答技术还不成熟,那为什么还要投身到这个领域呢。我想从To B和To C两个角度去回答。对企业来讲,当前的问答技术虽然无法解答复杂的咨询,但是大部分的简单的头部问题是可以比较好的解答的。从本轮AI大潮NLP赛道的几名种子选手都从智能客服这个方向切入就可以看出企业是确实存在对智能问答的刚性需求。而对普通用户来讲,一方面siri等语音助手每天都在为用户提供便捷的交互界面,另一方面像amazon echo这一类的智能家居产品也逐步进入千家万户,成为物联网生态的中心入口之一,这便是智能问答的价值所在。
那如何实现智能问答机器人呢?我们先来看最基本的单轮问答机器人的实现原理。
熟悉搜索引擎的朋友会发现这个架构跟搜索引擎的很类似。单轮问答一般来说就是FAQ问答,是基于业务问答对组成的问答库进行检索匹配。其中FAQ问题集包含多个相似问法供用户问题去匹配。预处理阶段一般会进行文本纠错,标准化和底层NLP特征提取;召回阶段会在倒排索引中召回若干个候选问题(粗排),而最后的匹配阶段会基于各种模型进行匹配打分并返回得分最高的结果(精排)。匹配阶段还会引入其他模块,如知识图谱和拒识模型,目的是辅助提升匹配的最终准确率。
retrieval中的匹配可以看做是naive solution,词袋+VSM, 筛选候选够用了,但是精排需要更精致的策略,第一,要利用监督信息做拟合,我们构建基于问题对的训练语料,拟合是否匹配这个二分类目标。第二,特征上抛弃稀疏的词袋模型,而是构造各种相似度来做base scorer,然后利用非线性的抗噪能力强的xgboost来做融合,比如我们用到词bigram, 字bigram, 核心词,名词等特征集合的相似度。这种方法的优缺点是一体的,由于模型只学习字面相似的特征,因此不受领域影响,通用性强,适合用在冷启动阶段;但也因为只考虑字面相似,无法处理更深层的语义匹配。
那如何度量语义的相似呢。词向量技术的兴起是语义匹配的前提,所谓词向量,是将孤立的传统的token表示映射到相互关联的向量空间中,这种关联性,或者说是相似性,是通过词语的上下文的来描述的。也就是说,上下文越相似的词语,他们的语义就越相似,词向量的欧式距离就越近。这是很容易理解的,更妙的是,通过对向量进行简单加减运算,能够呈现出概念的关系,比如king-man+woman的结果非常接近于queen, 因此说明词向量能够一定程度刻画语义。那对句子如何做向量表示呢?一个简单的想法是直接求和平均,WMD是另一个比较有意思且有效的做法,他将计算句子到句子的相似度建模成一个运输的问题,把句子p的各个词,运输到q的各个词上,也可以说是变换;运输成本是词向量的cosine相似度,而要运输的是各个词在句子中的权重,用线性规划求解一个最优解,即为p到q的距离。另外还有个有效的方法是SIF,思路是做词向量加权求和,但是突显出句子中非通用的部分,即权重用词频倒数来计算权重,实验效果也很不错。
上面的方法有一个问题就是没有利用有监督信息,所以效果有明显的天花板。下面介绍这个工作是基于深层网络做有监督学习的匹配的,做法也比较简单,首先把句子文本用one-hot编码,假如词典大小是500K,那编码完长度就是500K维,其实等于是词袋模型,然后输入到一个多层的神经网络去学习,最终得到一个128维的向量作为句子的语义表示,然后用cosine计算两个句子与文档的相似度作为模型输出。这个方法其实是将高维稀疏的token特征映射到低维语义空间,跟词向量的思路很类似,只不过训练目标不同,并且这里使用了深层网络结构。
但是CNN对上下文的处理能力依赖于窗口大小,远距离就没办法处理了,因此要考虑另一种网络单元RNN,这种单元是专门为时序模型量身打造的,简单来说,每一时刻t上的隐藏状态,或者说第t个词上的语义编码,都由两个输入共同决定,即上一时刻的隐藏状态和当前时刻的原始输入,而为了解决远距离传递导致的梯度消失和梯度爆炸等问题,RNN有一些变种结构来应对,比如 LSTM和GRU等。
CNN和RNN都是对原始输入进行语义编码的基本单元,编码后的向量就可以接入多层感知机进行相似度计算,如果是直接计算cosine相似度,那就是dssm的升级版,而更常见的做法是把两个句子的编码向量拼接在一起,再经过一个多层感知机计算相似度,而这种方法统称为表达式建模;
另一种方案考虑到两个句子之间的交互信息对学习他们是否匹配显然更为重要,这一类方案被称为交互式建模,右边是一个典型的例子,他最大的不同是首先对两个句子的所有窗口组合进行拼接和卷积,得到交互信息。然后再进行多次卷积和池化得到表示。其他的交互方式还包括编码之后,进行交互操作,如作差,点乘等,还有计算attention表示,也是常见的交互方式。
下面介绍我们的方案,跟上面介绍的模型相比,我们的方案主要做了两处改动,一个是使用了稠密连接的网络结构,让rnn层的输入和输出拼接在一起做为下一层的输入,第二个是混合注意力机制,即在计算attention向量进行交互式建模的基础上,增加self-attention向量计算,然后把两个attention向量经过门机制进行融合,这样做一方面引入了问句间的交互信息,同时又增强了对自身的表达建模。
上面的模型是比较复杂的模型,参数量有5.8M。在实际中应用中训练语料会严重不足,为了解决这个问题,我们引入了迁移学习的策略。首先第一种是多任务联合学习,比如在拟合两个问句是否匹配的同时,也对问句进行分类预测;另外还可以同时对匹配的问题对做seq2seq的翻译模型训练。这两个策略都证明能有效提升准确率。
而另一个思路更加直观,即引入其他领域的语料,所谓多语料迁移。Fine-tune即参数微调是其中一种做法,即先用通用语料训练网络,固定底层表达层的参数,然后再使用领域语料调整上层参数;另一种思路参考了对抗学习的思想,即引入一个新的任务“混淆分类器”去判别当前样本是来自源语料还是目标语料,通过在损失函数中增加反向的混淆分类损失项,让混淆分类器尽可能地无法区分样本的来源,从而保证共享了参数的表达网络能够学习到两部分语料中共性的部分。
以上的介绍都是为了完成一个基本的单轮对话机器人,而实际应用中,往往存在需要需要交互的场景,比如查询社保余额,就需要用户提供指定信息,如姓名,身份证号,手机号等。这种是所谓任务导向型机器人,而另一种,基于知识图谱的机器人也往往会涉及到多轮交互。这里简单介绍一下多轮对话机器人的架构,整体上是一个对话管理系统,总的来说是管理会话状态,包含4个模块,分别是输入部分:自然语言理解模块NLU,负责意图识别和抽取槽位实体,比如这里匹配到了意图是查询社保余额,抽取到了社保号1234。得到的意图和槽位值会送入到对话状态追踪模块,DST,他负责会话状态的更新,形式化来说是一个函数,输入是当前状态s和当前的query经过NLU处理过得到的意图和槽位值q, 输出新的状态s‘,下一步是把s’送入DPL,对话策略模块,这个模块是根据新的状态s‘输出行动a,通常这个决策选择会依赖于一个外部数据库或知识图谱,最后,由输出部分,自然语言生成模块NLG负责将行动转换为自然语言文本,返回给用户。
前面提到的单轮FAQ机器人,有一个问题是问答准确率依赖于问答库的质量,而问答库的构建耗时费力,所以针对数据较大的非结构化文档,如果可以直接从中抽取答案,是非常理想的做法。比如斯坦佛大学开源的drQA,就是基于wikipedia的语料做的一个开放域上的问答机器人,我们来看看这种阅读理解机器人的架构示意,他也是基于检索重排的思路,首先把可能的文段从语料库中摘取出来,然后送入阅读理解模型进行答案定位,打分,排序和选择得分最高的答案。阅读理解模型与匹配模型是类似的,需要先对问题和候选文段进行编码表示,不同之处在于最终预测的目标是答案的起始和结束位置。我所在的团队在去年,在阅读理解的权威公开测评Squad v1中取得过第一的成绩,同时参加这个测评的包括了google, facebook, 微软,阿里idst, 科大讯飞等国内外同行。说明业界对这种技术还是非常看重的。
下面分享小知在把以上技术落地产品化的经验。首先我们来看看小知的整体架构图,核心引擎有两部分,一块是上面重点阐述的深度语义匹配模型,另一块是本次分享没有展开的知识图谱引擎,在此之上,我们构建了FAQ机器人,多轮会话机器人(任务机器人),闲聊机器人等。以下是我们单轮和多轮机器人的示例。
在我们实际的落地项目中,得益于深度迁移模型的语义匹配能力和行业知识图谱的的精准匹配和辅助追问,小知机器人能够做到95%左右的问答准确率,并且节省了50%以上的服务人力,切实为政府和企业提升效率和降低成本。
在智能客服的基础上,我们又打造了基于语音的电话机器人,力主融合智能客服,人工在线客服,工单系统和电话机器人,为客户打造从售前售中售后的整体解决方案。
以下是电话机器人的整体架构图,核心是自然语言理解NLU模块,负责识别用户提问意图
提取相关实体。根据NLU输出的结果,内置的对话管理引擎会进行流程状态流转和跟踪。
另外,ASR语音识别和TTS语音合成是不可或缺的重要服务,这三个模块相互协作,共同完成与用户的交互。
最后对智能问答的未来发展提几点我的看法。目前学术界比较公认的一个方向是,需要更有机地结合模型和规则,而在问答领域,规则的一大组成部分就是知识图谱,包括开放领域的知识图谱和专业领域知识图谱。而更进一步地,我们需要研究带有推理性质的事理型知识图谱去描述领域内的规则和知识,让机器人能够处理带有复杂条件的问题,提供更智能的回复。在我看来,智能问答的一个突破口就在于解决以上三个问题。以上就是今天分享的内容,谢谢大家。
主讲人介绍:
陈松坚,腾讯数据平台部算法高级研究员,有着8 年的 NLP 研发经验,2017 年加入腾讯 TEG 数据平台部,负责智能客服产品腾讯小知的算法规划和落地。负责过多个智能客服项目,对封闭领域的智能问答有丰富的实战经验。
二、工作中有什么困难如何回答
工作中有什么困难如何回答
工作中有什么困难如何回答,在我们的职场中其实有很多的知识都是需要我们了解的,各行各业在职场上需要了解的内容和要求也都是有所差别的,以下了解工作中有什么困难如何回答。
工作中有什么困难如何回答1
问这个问题的用意是什么?
这个问题在面试中经常碰到,我自己面试的时候,也喜欢问这个问题,这个问题可以考察候选人面对困难的能力。
1、 根据碰到的难题,找到可能的弱项
一个候选人说出自己的工作中碰到的难题,根据候选人的难题,可以把难题分为四类:知识、技能、业务、沟通, 在对应的分类上,做进一步的追问, 看看是不是由弱项,当然这个弱项不是说真的不行,而应该看难题的难度。
根据难题的水平,可是知道候选人的水平,如果是一个简单的问题,而说成是难题,这说明候选人平时的工作难度不大,碰不到难题,又或者是候选人能力不行,这么简单的都作为难题。
如果这个难题是真的难,说明候选人平时工作的是重要的、核心的任务,真的是有水平的。
2、 根据解决问题的思路,可以知道解决问题的能力
候选人答完问题以后,需要做一个追问,怎么解决问题的? 这个解决问题的思路,可以很好看出候选人的分析思考能力。
有的人是自己查找资料,有的人是搜索引擎,有的人寻求帮助, 这些都是可行。
解决完问题以后,后续对于难点有没有复盘,有没有优化方案,有没有在团队做分享也是一个很重要的点,如果有做分享,这次的问题解决成为团队的知识。
3、 有没有难题,可以知道对于项目参与程度
在面试中,有些候选人在团队里面,只是做一些简单的打杂的事情,然后他自己说核心成员,如果识别,可以从他说的问题中知道,如果问题简单或者没有问题,估计是没有深度参与的项目的。
应该怎么回答?
这个问题可以看到自己与别人的区分,特别是自己解决问题的能力,特别是解决难题的能力,这是加分的选项,所以要好好回答。
1、平时碰到问题,解决了,记得复盘总结
平时碰到了问题,自己思考、尝试,搜索,咨询别人、跟别人请教, 无论是怎样解决,不能就这么完事了。解决以后,特别是难题,需要对问题进行复盘总结。
复盘总结能力是一项非常重要的能力,针对这个问题,可以总结解决思路,以后碰到类似的问题就可以套用,还有就是可以把解决方案写下来,甚至写成Blog在网络上发表,相当于给自己做了一个笔记,同时也方便了其他人,这样可以加深印象。
这样,当面试官问平时遇到过什么难题的时候,你可以手到拳来, 把自己的难题库或者是博客拿出来,跟面试官说一遍。
2、 可以使用star法则回答
STAR法则,即为Situation Target Action Result的缩写,具体含义是:
Situation:事情是在什么情况下发生
Target:你是如何明确你的目标的
Action:针对这样的情况分析,你采用了什么行动方式
Result:结果怎样,在这样的情况下你学习到了什么
通过STAR法则,把自己的问题描述出来以后,并且把自己是如何解决,学习到的经验教训都说出来,这样既清晰又全面。
当然,讲到问题的时候,可以讲一些细节,渲染下难度,后面学习到的东西,可以拔高一下。
回答的误区是什么?
当然了,回答这个问题,最怕的是问题过于简单,这样面试官觉得你水平太差,这就是平时不注重积累,没有把自己解决问题总结,只是把问题解决就完了。
当然,说了难题,一定要说解决方案,如果没有解决方案,那还不如不说。容易陷入尴尬。
工作中有什么困难如何回答2
被问到“工作中遇到最困难的事”时,该怎么回答呢?
其中,任正非谈到了一个问题:“面试时发现被访者的长处,跟随他的长处来了解他,让被访者在20分钟内谈论自己的情况就是像纸上解释自己的水平。 再来一次,然后问有关他的长处的问题,不要太过仔细地检查他并吓他。非常重要,面试官应该找到候选人的长处和长处,并在将来使用候选人的长处而不是专注于他们的弱点,我发现了一些困难,奇怪的问题,检查了他,吓到了他,我真的 高兴,吓跑候选人或发现不需要的东西。
这在新手访问员中更明显,目的是展示他们的能力。为了找到候选人的长处和长处,除了候选人自己的陈述外,访问员还将 还会问:“您在工作中遇到什么问题?”面试官回答后,还会问:“您是如何解决的?”
参加团队的任何人都将知道您可能会遇到各种问题,例如队友 不相信你,高级员工不信服,成员不相处,各种各样的帮派,听不见别人的话,每个人的目标都不一致……等等。这些都是正常的,但是你是 只有一个没有遇到“分工”问题的人。
为什么? 因为“根据能力,专业知识和任务要求合理地分工”,这基本上是团队经理最基础,最日常的工作! 这就像听到数据分析师说的那样:“我最大的困难是使用EXCEL。” 这不是荒谬的吗? 我通常会遇到问题,思考,尝试,搜索,咨询他人,并向他人寻求建议。 无论您如何解决,都无法完成。
解决问题后,尤其是问题后,需要对问题进行审查和总结。 审查和总结的能力是非常重要的能力。 对于此问题,您可以总结和解决想法,以后在遇到类似问题时也可以应用它。
另外,您可以写下解决方案,甚至将其写为博客,然后在Internet上发布。 于为自己做笔记,对别人也很方便,可以加深印象。 这样,当面试官问您通常遇到什么问题时,您可以举起拳头,拿出自己的.问题库或博客,然后再次与面试官交谈。
工作中有什么困难如何回答3
工作中的困难如何解决
不断学习,找寻方法
面对困难,如果一味逃避绝不是解决之道,因为问题始终在那里,迟早要面对,要解决掉,与其坐以待毙,还不如积极学习,请教别人,寻找方法!
勇于行动,不断尝试
找到方法后要勇于尝试,只有不断尝试才能解决问题,哪怕是错误的或者失败的也要去行动起来,至少你已经开始与困难做斗争了!
不怕失败,总结经验
人生不如意事十之八九,所以当你失败的时候不要灰心丧气,平常的看待,这在你人生的长河中或许只是一个小小的波浪,所以不要害怕失败,认真总结经验教训才重要!
保持理智的思维
要相信困难永远没有办法多,所以说困难只是暂时的,只是还没有找到合适的解决方案,时刻保持理智的思维,不要被暂时的困难冲昏了头脑做出以下糊涂的决定,千万不要在自己愤怒或者沮丧的时候做出决定。
遇到困难怎么办
面对这些生活的繁琐,也曾想过逃避,可是你要明白逃避并没有用,遇到困难,首先不要想逃避,逃避永远不会是个好方式,冷静分析你遇到的困难自己有没有办法解决,即使很麻烦,这就成功了一半了。
自己解决不了的事并非别人也解决不了,适当的示弱并不会降低你的自尊,如果你一昧的坚持自己的观点,不肯低头,即使别人想帮你,也会被你扎的鲜血淋漓,不敢再靠近。
发泄是一个好方法,如果你现在已经是心烦意乱的状态,把问题抛到一边,你现在的情绪智慧把事情变得越来越糟糕,大声的喊或歌唱是不错的释放方式,到海边、天台或者空旷的地方都是不错的选择。
发泄完之后,你肯定发现自己的脑子清醒了不少,现在再来思考问题思路就比较清晰了,只要你想,没有完成不了的事,我也曾陷入心烦意乱,也曾钻牛角尖,但是我一直坚信没有解决不了的问题,保持乐观的心态很重要。
最后呢,再说我经常用的一种方法,写日记或者比较私人的网站,你的朋友都不知道的那种,在那里,你可以想写你心里所有想说的话,包括骂人的,等等都可以,当然,发泄过后还是要面对问题,解决问题的
工作上遇到困难怎么办
困难面前逼自己一把
当你遇到难题,你不要一开始就想着退缩,不想去闯也不想去承担,你不妨试试逼一下自己,万一成功了呢,不要把自己想的太过渺小,你勇敢前进试一下,说不定你自己都不知道自己的潜力有多深,你也不知道自己能到达哪里,困难是检验自己的最好证明。
把困难放小,看淡
我们在生活中碰到的每一件事,都要秉承大事化小,小事化无的原则,困难也是,你把它看的很大,它就真的大,你把它看小,它其实就是那么小,困难面前你强它就弱,你弱它就强。
把困难当做朋友
当你做一件事出现了难题,不要气急败坏,把困难看成敌人一样非要消灭不可,其实困难就像是朋友,有了它你才会想办法解决问题,你才会前进,有了它,你才会居安思危,时刻保持向上的精神,所以要把困难当成朋友,时刻陪伴左右,你的人生才更精彩。
工作中遇到困难怎样处理
首先,每个员工在解决问题的时候都有自己的一套认知系统。如果反复解决不了,可能问题本身已经超出了自身的认知范围。
其次,如果这个问题需要浪费很多时间的话,那遇到这种难题的时候,其他同事因为自己手头的工作也很难有空帮助你。
再次,你要去找领导的话,领导一开始总是不大理睬具体问题的。他会说,我花钱请你来公司就是解决问题的。除非你是那种阿谀逢迎的高情商者,否则很难说动他的。
最怕遇到存在竞争关系的时候,你的难题恰恰是某些有竞争关系的同事拿来说事的筹码。天天数落你这不行,那不是,一副嫌弃得不得了的样子。他们所想的无非是给你制造更多的麻烦,非要逼你离开公司而已。
那么在工作中的困难是不是你一个人的呢?如果领导就给你一个人分配这个任务,你只有找他商量是不是能多分配一点人手或者另请高明。
如果是开明的领导,为了工作一定帮你解决。倘若是要故意整你,那这个困扰可能就伴随着你的离职结束了。
所以,遇到困难尽力解决,实在解决不了或者接受不了溜须拍马的所谓高情商,那彻底离开这个困扰,让心情好起来。
三、JAVA面试时当被问到hibernate中的N+1问题时,应该如何回答?
1 )lazy=true, hibernate3开始已经默认是lazy=true了;lazy=true时不会立刻查询关联对象,只有当需要关联对象(访问其属性,非id字段)时才会发生查询动作。
2)二级缓存, 在对象更新,删除,添加相对于查询要少得多时, 二级缓存的应用将不怕n +1 问题,因为即使第一次查询很慢,之后直接缓存命中也是很快的。
不同解决方法,不同的思路,第二条却刚好又利用了n +1 。
3) 当然你也可以设定fetch=join
四、百度为什么要我提问?
你好!
我简单说几句吧,有很多人有你这个疑问!
【1】百度首先要让你了解过程,要了解百度知道的使用过程
【2】并且希望通过任务给你一定的奖励!
【3】希望让所有用户都参与问答过程,体验分享快乐!
想起来别的我会继续补充!
【新手任务,是吧!】
以上就是关于库问搜索为什么用不了相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读: