Google Bard作为对标ChatGPT的生成式大语言模型,在目前的几种大语言模型排名中还是排在前列的。
Google、OpenAI都有自己的大语言模型商业化产品,Meta则是走的开源(半开源?)路线。
针对日常工作中的使用场景,我会写一下关于如何使用Google Bard这个工具提升我们的工作效率,记录下来方便以后对大语言模型进行更好的使用改进提供帮助。
比如最近我的工作中,就需要用到地域信息抽取的功能。 由于网上流传了一份2023年落马的医疗反腐名单,这份名单是从1月份以来从各大官方网站发布的的纪律审查通告中记录的各省份医疗单位中院长、副院长、党委书记等落马名单。由于名单中只有医疗机构的名称,并没有单位所属的地域信息,如果我需要根据这个单位信息做一份地域分布图,那么就必须要根据单位名称抽取出地域信息,从而生成这样一份地域分布图。
目标清楚了以后,就是开始行动了。
一、图片转文字
由于网上流传的这份资料是图片形式存在的,那么第一步当然是图片转文字了。网上有相应的免费工具,可以很方便的把图片里面的信息全部提取出来。
这是我生成出来的文字版文件,点击下载。
二、使用Google Bard提取地域信息
由于Google Bard类的大语言模型都有字符长度限制,如果我们一次性提供全部的医疗单位给Bard处理,是会超出他的字符限制的。那么他返回的结果就是不完整的。这里我们只能分批进行数据处理。
打开Google Bard节目,在提示词输入框中输入下面这段文字:
下面是一批医院的名单,我需要根据单位名称抽取地域名称,最好能到市县以及到地面,比如"广东阳江市阳东区妇幼保健院",抽取结果为:“广东阳江市阳东区”,返回到结果使用csv格式表示。 广东阳江市阳东区妇幼保健院 西藏自治区藏医院 重庆垫江县中医院 广东揭阳市第三人民医院 广东汕头市潮南区中医医院 广东江门市新会区人民医院 湖北随州市智都区中医医院 湖北省中医院 广东怀集县人民医院 山东省立第三医院 四川凉山州第一人民医院 广东封开县第一人民医院 江西宜春市袁州区南庙镇中心卫生院 江西宜春市袁州区卫健委疾控股股长 云南昭通市中医医院
Google Bard 返回的结果如下图,我们可以看到他非常强大,直接返回了CVS表格形式的结果。
而且,点击表格下方的“Export to Sheet”的连接,可以把这个结果直接导出到Google Docs上,并且保存到Google Driver上的。 从返回到结果来看,正确率非常高啊, 想象一下,如果我们人工来处理这样的工作,100多条数据的处理,至少也的话费1-2个小时吧,你可能觉得这也还好啊,就1-2个小时也能做的了。 但是Google Bard强大的地方是,我现在需求改变了,我需要把数据处理成地域信息更加详细,分类成 省、市、区、县 这样的格式,那么我看下Google Bard的表现吧,我们只需要稍微调整一下我们的提示词就可以了,比如这样:
|
|
可以看到,Google Bard直接按照我的需求,把地域信息划分成更细粒度的属性返回给我了。 而我的工作量几乎没有增加。如果人工来处理,我估计做事的人要开始骂人了:“什么鬼,早不说清楚,现在又来改?” 如果有更多的数据需要处理,我们不需要每次都输入很多的提示词,只需要在后一次的提问中,这样写,Google Bard就能很聪明的帮你重复工作:
|
|
这样来看,Google Bard可以极大的提供我们的人工效率,确实是我们人类的好帮手。 三、根据数据制作地图分布
由于数据比较敏感,大家可以根据下面的代码进行自动生成对应地图。 我另外,抽取了岗位信息,并做了一个柱状图,大家感兴趣的可以自己学习。
|
|