《Web信息架构》-搜索系统

搜索系统:也是一种导航方式,简单的比如一个博客的搜索系统,复杂的比如Google,baidu。当然对于用户检索信息来说应该是最实用的工具之一,只要输入“关键字”,然后点击“搜索”按钮就可以完成,但如何给用户有一个匹配度高的搜索结果是比较复杂的,这又涉及到研究用户体验和交互。

[网站需要搜索功能吗?]
1.网站内容量多。
2.研究搜索系统时,忽略导航系统,分轻重。(当然也些网站是以搜索系统以为主导)。
3.花时间做搜索结果的优化。
4.如果你没有做搜索系统的技术、人才资源…..
5.你的用户可能宁愿浏览也不要搜索,也有时用户需要搜索功能的优先级较低。
6.考虑预算,成本。
7.搜索让用户和制作者了解现在网站上目前只有哪些内容。
8.通过搜索日志,分析数据、搜集数据(用户实际想得到什么,如何表达需求)。
9.固定搜索功能在网站上的位置,比较导航栏边上,这些可能用户会有搜索需求的地方。
10.梳理网站动态性更新。保持网站的分类和即时性结果。比如今天在博客里写了一篇[关注2010世界杯]的文章,明天朋友来访问博客时,搜索“足球”,文章[关注2010世界杯]就会出来。

[搜索系统详解]
重点是研究影响搜索系统效果的因素。影响搜索系统的效果的因素涉及:搜索数据的配置方式、搜索界面、结果排序、反复查询、高级查询、整个搜索系统与用户的交互过程。

[搜索不是一种IT玩意]
与涉及设计搜索系统的各部门人员沟通,团队合作。

[选择要搜索什么]
哪些内容应该做索引以供搜索?

  • 建立搜索区域,内容的同质性:在特定的情境中用户想搜索最新足球新闻,不要加杂篮球新闻在其中。
  • 让什么可以搜索:每一个文件和记录都有某种结构,这些结构会储存在内容组件中:就是内容的元素,通常比文件本身小。结构中某些东西可以被搜索引擎使用,如作者姓名;而某些可以被忽略掉,如每页底端的法律声明。
  • 网站中“好”(推荐)内容:这个概念类似于TaoBao中搜索”apple”时,商城的信息会列信息列表的最上面。

[决定搜索区域]
当用户搜索某一搜索区域时,他通过表明只对特定信息感兴趣,理想情况下网站中的搜索区域对应用户的特定需求,得到更好的搜索效果。

网站本身性质及内容的分类来做区域的搜索条件,比如DELL网站按选择用户类型,搜索相关电脑产品的主题(找驱动,找维修点等)。这样搜索页面是以新的,有目的方式重新组织页面,提供用户以不同的搜索界面,说白了就是我们平时看到的网站[高级搜索]。

搜索区域的分类方法:内容种类、用户、主题、地理位置、年表法、作者、部门(这些分类方法都是死的,不同的网站还是要根据不同的需求去分类,比如taobao搜索中还会分促销宝贝,爱心宝贝,全球购,货到付款。(如图1)

图1

[对什么内容做索引]
就是选择哪些内容被搜索到并在搜索的结果中显示出来。
1.文章主体(最好是和关键字相关的部分文字内容)。
2.标题。
3.URL。
4.网站名称。(特定的情境中,比如Google中搜索时)
5.链接。(也有可能是文字链接)
6.图像链接。
7.图像的替代文字。
8.说明。
9.关键词。
10.远程锚文本。
附其中几点也符合网页对搜索引擎的优化

[搜索算法]
模式匹配算法:查全率和查准率
查全率=搜索出来的相关文件(集合中的所有文件)
查准率=检索出来的相关文件(集合中的相关文件)
看这节的内容还是看Google黑板报[科学与技术],[中文网站管理员博客]来的实用,深刻。

[查询辅助工具]
增加查询效果的工具,通常用户看不见这些工具(说白了就是一些提供搜索帮助的技巧的功能,比如你在taobao搜索,由于字打的快输入了“诺鸡亚”,搜索结 果首先会显示“诺鸡亚”结果为0,但会提供一个更正并提示你找的是不是“诺基亚”,并列出“诺基亚”的相关内容,可惜现在还不会,都只是些不相干的提示) (如图2)

图2

拼写检查工具:用户拼错术语时,自动样正搜索术语,把正确的结果搜索出来。
语音工具:通过发音,同时搜索发音相同的字、词、单词。
词干搜索工具:
搜索含有相同词义的术语。(就是词义联想)
自然语言处理工具:
检查语法的本质,你是想“下载”文件,还是“浏览”文件,窄化搜索结果。
爱控词表和叙词表:
第9单细述:啥眼-_-!
以上功适而用之。

[展示结果]
显示哪些内容组件,以及如何分类,如何列。
显示哪些内容组件

  • 对 那些已经知道自己要找什么的用户而言,就显示代表性的内容组件,协助用户区分搜索结果,如用户搜索“《Web信息架构》”,搜索结果应该是相对于狭隘;对 那些不确定自己找什么的用户,可以从描述性的内容组件,对搜索结果产生一种联想,如用户搜索“送礼”,搜索结果应该广义很多。
  • 在搜索结果显示的内容相同时,应用多显示一点相关信息作再作区分,如用户搜索“《Web信息架构》”,搜索结果中还会附加此书在不同店的不同价格。(如图3)
    图3
  • 组织好每一个文件中有哪些内容可用以及内容怎么用,帮助直接得到搜索结果,如用户搜索“杭州外婆家”,结果有会有电话号码和地址。(如图4)
    图4
  • 显示的内容没多少组件,则加强搜索术语的搜索结果中的视觉重心,如用户搜索的关键字总是在搜索结果页中变粗,变红,总之变的醒目。

要显示多少文件?
控制每条搜索结果的内容,给出总的搜索结果数量,数量多的话设计导航,排序方式等交互功能

[列出结果]
排序(sorting)各排名(ranking)
按字母排序:图书类
按年有排序:即使新闻类(从新到旧)。还有一种是历史(从旧到新)
按相关性排名:

  • 搜索出的文件中含多少个查询字符串中的术语?
  • 术语在文件中出现的频率。
  • 术语出现的位置。例如,相邻?同句?同段?
  • 术语出现在何处,出现在的标题比出现在正文中相关性要高。
  • 查询术语出现所在文件的受欢迎程度(PR值)。

不 同的相关性排名对不同的搜索目如何更有意义?文件A可能比文件B排名高,但B相关性高,为什么?因为B是引用参考文件,具有真正的相关性,而文件A只是一 份很长的文件,碰巧有很多查询字符串中的术语。所以同类文件的异质性越高,就是更要小心使用相关排名?还提到[人工处理结果],[给结果打分]这些相关性 排名方法。
根据受欢迎程度排名:网站PR值,指向页面A的链接越多,越说明页面A越有价值。比如网上有两篇同名同内容的文章A和文章B,有100张页面指向文章A,有10页面指向文章B,那文章A会显示的比文章B靠前。
当然提供指向链接的这张页面本身的PR值也很重要,比如有100张页面指向文章A,也有100页面指向文章B,这时文章AT 和文章B的前后显示顺序就要考虑这些张页面本身PR值了。是的,这种做法不适合小型网站!
用户或专家排名:通过用户的评价或者专家的分析决定排名。比如口碑上找“川菜”,这种通过用户评价规划搜索出来的结果很具有参考性,当然这些评价中也可能会有托。
按订单付费排名以前b干这事,G也干,不过G干的比较厚道。
分组结果主题类型群组去分组结果,为结果提供情境,选择最感兴趣的目录,就能缩小浏览范围。(如图5)

图5
[导出结果]

打印:一种保存的概念,这个好像有点超出讨论搜索系统的范围,感觉话题用[网页快照]形式更好。
寄送:这个感觉又是讨论购物车,收藏类的概念。
储存结果:有些情况下,用户想保留搜索本身,而不是结果。这个是类似google alerts,rss的概念。有些用户可能不会用这些功能,他们只保存了搜索结果的URL链接:如用户收藏了某个链接,用户在下次通过收藏夹访问这个链接内容有所更新。

[设计搜索界面]
影响搜索界面的外在不确定性因素:
使用通俗的查询语言。
用户搜索时提供的关键字越少对他们来说越方便,但搜索结果他们不希望打折。
高级搜索的一些功能,可以内嵌到搜索引擎里面。如Google对用户想要什么种类的结果(通过相关性算法)以及他们希望结果怎么展示(使用受欢迎程度算法),做了很多假设。

[搜索框]

  • 用户在看到搜索界面时,会联想他的功能及使用方式,尽量让网站的搜索方式跟着大众化的搜索方式走。比如一般网站搜索都支持同时输入两个关键词这样的搜索条件(两个关键字之间加空隔)(如图6),用户当然也希望在其它网站搜索时,也可以用这种方式搜索。
    图6
  • 当用户第一次使用你网站的搜索,在看到搜索结果的界面时,是提示和帮助用户如何继续纠错及进一步操作的好时机。比如在WJS搜索图6的内容,你会发现(如图7)
    图7
  • 别把搜索框和其它的INPUT框放在一起,保持独立性和统一性。
  • 节省空间,在你需要为搜索类型分类的情况下,可以使用下拉列作为一种搜索条件(如图8)

图8

试着去研究了解用户会在搜索前对搜索的一些想法,可以让你在设计简单的搜索界面时设定一些默认值。

[高级搜索]

高级搜索有总比没有好。把搜索引擎各种高难度的搜索功能放到高级搜索页面,让那一小部分用户在需要时仍能使用。但是,设计搜索界面的目标是让多数搜索者无需要访问高级搜索页面(做成看上去比较复杂的界面)。

[支持修改功能]
在结果页中重复搜索:
在搜索结果页出来后,搜索框中显示最初的搜索字符串,让用户可以修改,而不是重新输入。
说明结果来自何处:让人搞清楚搜索出来的内容是什么,来自哪些分类,然后决定扩展或者窄化搜索?(如图9)

图9
说明用户做了什么:让用户了解情况。在搜索结果中体现出刚才搜索时所设置的内容,并提供可修改的的功能。如(图10)

图10

在使用高级搜索时所设置的一些特殊内容,再看(图11),用户可以对应并修改刚才所选择过的内容,并且提供更多的选择窄化结果,并得出精确的结果。

图11

整合搜索与浏览:搜索时会检索出目录和文件,浏览时会导致搜索框被设定为该区域。用户选择一本书,相应的搜索分类就进入“图书”的类。(如图12)

图12

[用户被绊住时]

当结果太多或者结果为0时怎么办?
结果太多:可以让用户通过更深入的需求去精确要求、排序内容,从而筛选并按要求显示。如(图13)红色区块部分

图13

结果为零:“无尽头”的策略解决这种问题,除了第2条前半句比较靠谱,其它感觉比较“无厘头”

  • 修改搜索。
  • 提供搜索技巧(如图7)或其他其它改进搜索的建议。
  • 浏览的工具(包含网站的导航系统和网站地图)。
  • 搜索和浏览无法动作,就提供联系方式。(完)

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注