公司新闻 > 机器能写新闻了,解读化验单这活儿也能干?

机器能写新闻了,解读化验单这活儿也能干?

2016.07.22 来源:雷锋网

说起来中关村,从来不缺少的就是热情-创业的热情。医疗创业团队拍医拍的办公地点就在这一带。

创始人兼CEO吴诗展告诉雷锋网编辑,为了做这款产品,“我寻访了中国一半以上的OCR(图像识别技术)高手,一拍即合的就一拍即合了,没能一拍即合的也一直在关注项目进展并不时建议。”他向记者展示了一个非常庞大的微信通讯录,里面都是他曾经聊过的做OCR的。

联合创始人刘立、杨劲松、angelera就是他这样一拍即合的聊来的。刘立先 后在Panavision和Omnivision公司从事数字成像技术研究的工作,杨劲松有15年的从医工作经验,有着北京大学人民医院、好大夫在线医学 总监的工作经历。Angelera原是百度OCR和深度学习技术方面的重要推动者,也是国内资深的文字识别和人工智能领域的专家。吴诗展曾在赶集网、百度 等公司从事大数据相关工作。

机器能写新闻了,解读化验单这活儿也能干?

正 如他们的技术+医疗的团队属性一样,拍医拍的APP产品也是这样的路数。利用技术手段来分析医疗单据。简单来说,这款产品是利用自身的图片文字识别技术, 通过手机对化验单进行扫描,然后系统给出化验结果的可能性分析,并给予相关的健康管理建议,在机器无法识别出化验单的结果时,会由后台的医生团队来给出解 读,后续再由医生来教给机器来识别。

机器能写新闻了,解读化验单这活儿也能干?

有医疗行业业内人士向记者表示,这种技术+大数据应用于医疗领域的想法是好的,但实现起来比较困难。化验单一般是辅助诊断的,除非是某一项特定指标特定指向某一种病,这样才能通过解读化验单得出结论。否则通过扫描来解读化验单的意义不大。

对于质疑,拍医拍的创始人们说,他们并不是要做确切诊断和结论,而是要帮助用户更加了解自己疾病,而且会之后会加入智能问询的功能,让化验单直接和特定疾病挂接起来。

雷锋网:您想把拍医拍做成一款什么样的产品?或者说想要实现什么样的目的?

吴诗展:患 者经常会为了看病排一天队,让医生来看一分钟,对各种单据进行解读,非常痛苦。我们想做的事就是用户只要在医院做了检查,给化验单拍张照,用我们的产品扫 一下,我们就有权威的医生来进行解读,给出一个比较详细的解释。一个指标异常可能是什么含义,多个指标异常可能是什么疾病。让患者跟医生去沟通的时候更加 了解自己的状况。

开始用户上传某一化验单,我们给出的是单次解读的结果。随着用户不断上传,我们会通过OCR技术,把化验单上的数值提取出 来,把历次的化验数据存到云端的数据库后,根据数据趋势性的变化,来给出健康建议。健康数据在云端数据库存储以后,还可以建立电子健康档案。目前的产品还 是只能提供单次解读,多点解读还在开发当中。

另外,上传多次化验单之后,是可以给用户打上标签的。像《今日头条》,用户不断看新闻以后,会给出兴趣标签。而我们给用户打的是健康标签、患病标签,有了这个标签以后,会根据不同用户需求,向用户推送个性化的医疗健康资讯、食谱、电商等信息。

雷锋网:那如果一个用户第一次上传的是自己的化验单,下一次又上传的是家人的化验单,这个标签要怎么定义呢?

吴诗展:我们的APP是以家庭为单位不是以个人为单位的。后续迭代开发中,会增加这一项,给不同的家庭成员贴上不同的身份。

雷锋网:刘博士,您能谈一下OCR技术跟医疗结合的难点在哪儿吗?

刘立:图 像识别技术有不同方向的应用,大体上讲就是根据图像或者内容来判断图像代表什么意义。图像识别技术实际上是分两步,第一步是检测,第二步才是识别。我们关 注比较多的是文字的识别,同样是先检测文字,再去识别文字。难度在于首先要在图片上找到文字,机器要利用一些特性来判断哪里是文字。文字识别技术其实在很 早很早以前就有了,应用场景就是扫描仪。扫描仪扫描的是文档,是在成像条件非常好的条件下进行的。我们的机器要扫描的图片是用手机拍摄的。如果在成像较好 的情况下,图像识别就比较容易,但手机拍摄图像质量会比较差,而且会存在把原物拍变形的情况,这样识别起来就会比较困难。我们就是要处理这种情况下的图像 识别。

另外,对于人来说能够很明确的知道文字的部位在哪里,但是对于机器来说就比较困难。而且不同的医院、不同的检测机构的 化验单都不一样,那一开始就要先做一个版面分析,而我们的核心专利可以直接抛弃人工创建模板,让机器自动学习不同医院的版式,这些核心问题我们都有了很大 突破。

目前图像识别和医疗的结合是做化验单的识别,以后还可以扩展到相关场景。比如,对药盒上文字的识别,来帮助老年患者。

雷锋网:我们做化验也是要去医院,那为什么不直接去找医生直接解读呢?这款产品对于一些较深层次的信息解读也是由人工来完成的,那扫描化验单的意义在哪儿?会不会存在误差反而误导用户?

吴诗展:医 疗有一个很大的问题是极度的信息不对称,患者的(医疗知识)水平比较低,医生的水平比较高,我们这款产品是介于医生和患者之间,让患者更了解自己,更了解 疾病本身。我们产品在现在这个阶段不是想说要去代替医生,而是要去帮助医生。因为医生是一个非常辛苦的职业,医生每天要面对大量的病人,短时间内根本不可 能给患者一个非常详细的解释。我问很多医生说,你们会给患者很详细的解释化验单吗,他们都说,我们也想,但确实没时间。

至于误差,后续我们也在研发一些智能交互技术,通过引导的方式来获知更加详细的用户身体状况来对化验单结果进行更加准确的解读。

雷锋网(搜索“雷锋网”公众号关注):这款产品扫描完化验单以后只是给出一个可能性的结果,比如某一指标异常,可能是什么样的状况。那作为医生来讲,还是要从化验单本身入手,再去解读,而这款产品给的预判对于医生来说有什么样的意义呢?杨医生,您怎么看?您身边的医生朋友怎么看这款产品?

杨劲松:医生在给患者解释化验单的时候不会特别详细,很多病人,尤其是看过很多病的病人,他们特别希望知道更多信息,对于医生给出的信息,他们是不“解渴”的。

还 有就是医学科普的意义非常重要。比如说红斑狼疮,育龄期女性患者是不适宜生孩子的,如果想要生孩子需要做层层的保护,要咨询有经验的专家。可能有些患者并 不知道这些情况,这种患者怀孕以后母婴的死亡率很高。这些知识是需要通过一种途径去普及的,我们的健康指导里会有相关的内容。

化验单只是我们的切入点,后续我们还会引入CT、核磁、B超等等,会把这些内容丰富起来。可能平时的血常规、尿常规等等确实不能给出一个确定的结论,但医学也在追求一个“金标准”,也就是说利用某一项指标就可以确定为某种疾病,事实上很多疾病都是有金标准的。

医生非常希望把我们这个产品的技术用到科研当中去,因为他们要搜集一些数据。这些数据从医院的信息系统里是导不出来的,化验单变成电子化的东西以后,就可以搜集一些实验数据。但我们觉得科研这一端的需求并不是很大。

雷锋网:现在的产品是有一部分机器无法识别的由人工来识别,再由人来教给机器。化验结果是非常复杂的,是不能穷尽结果来教给机器的,那这个怎么解决?

吴诗展:我们把卫生部公布的3000多个化验单的指标都已经覆盖了,单指标的我们已经完成了 ,多指标的扫描我们还在完善中。

后记:移动医疗,有人说是伪命题,也有人看好它巨大的市场潜力,一批又一批的医疗创业公司前仆后继。对于拍医拍而言,不管其最终的愿景能否实现,至少它们对于技术在医疗领域应用的探索是值得肯定的。