8、Django全文搜索
概述
博客文章通常包含标题和正文两个部分。当用户输入某个关键词进行搜索后,我们希望为用户显示标题和正文中含有被搜索关键词的全部文章。整个搜索的过程如下:
用户在搜素框中输入搜索关键词,假设为 “django”,然后用户点击了搜索按钮提交其输入的结果到服务器。
服务器接收到用户输入的搜索关键词 “django” 后去数据库查找文章标题和正文中含有该关键词的全部文章。
服务器将查询结果返回给用户。
整个过程就是这样,下面来看看 Django 如何用实现这些过程。
将关键词提交给服务器
先来回顾一下我们的 Django 博客的 Post(文章)模型:
先看到第 1 步,用户在搜索框输入搜索关键词,因此我们要在博客上为用户提供一个搜索表单,HTML 表单代码大概像这样:
特别注意这里 <input type="search" name="q" placeholder="搜索" required>
中的 name 属性,当用户在这个 input 中输入搜索内容并提交表单后,键入的数据会以键值对的形式提交服务器,这个键的名字就是通过 name 属性指定的。这样服务器就可以根据 name 的值来取得用户输入的内容。
用户输入了搜索关键词并点击了搜索按钮后,数据就被发送给了 Django 后台服务器。表单的 action
属性的值为
(虽然我们还没有写这个视图函数),表明用户提交的结果将被发送给 blog 应用下 search 视图函数对应的 URL。
查找含有搜索关键词的文章
搜索的功能将由 search 视图函数提供,代码写在 blog/views.py 里:
首先我们使用 request.GET.get('q')
获取到用户提交的搜索关键词。用户通过表单 get 方法提交的数据 Django 为我们保存在 request.GET
里,这是一个类似于 Python 字典的对象,所以我们使用 get
方法从字典里取出键 q 对应的值,即用户的搜索关键词。这里字典的键之所以叫 q 是因为我们的表单中搜索框 input 的 name 属性的值是 q,如果修改了 name 属性的值,那么这个键的名称也要相应修改。
接下来我们做了一个小小的校验,如果用户没有输入搜索关键词而提交了表单,我们就无需执行查询,我们给给用户发一条错误提醒消息,这里使用了 django messages 应用,这在 交流的桥梁:评论功能 中讲过。然后将用户重定向到首页。这里的 redirect 函数也在那篇教程中讲过。
如果用户输入了搜索关键词,我们就通过 filter
方法从数据库里过滤出符合条件的所有文章。这里的过滤条件是 title__icontains=q
,即 title 中包含(contains)关键字 q,前缀 i 表示不区分大小写。这里 icontains
是查询表达式(Field lookups),我们在之前也使用过其他类似的查询表达式,其用法是在模型需要筛选的属性后面跟上两个下划线。Django 内置了很多查询表达式,建议过一遍 Django 官方留个印象,了解每个表达式的作用,以后碰到相关的需求就可以快速定位到文档查询其用途 Field lookups。
此外我们这里从 from django.db.models 中引入了一个新的东西:Q 对象。Q 对象用于包装查询表达式,其作用是为了提供复杂的查询逻辑。例如这里 Q(title__icontains=q) | Q(body__icontains=q)
表示标题(title)含有关键词 q 或者正文(body)含有关键词 q ,或逻辑使用 |
符号。如果不用 Q 对象,就只能写成 title__icontains=q, body__icontains=q
,这就变成标题(title)含有关键词 q 且正文(body)含有关键词 q,就达不到我们想要的目的。
绑定 URL
有了视图函数后记得把视图函数映射到相应了 URL,如下。
大功告成,在导航栏尝试输入一些关键词,看看效果吧!
当然这样的搜索功能是非常简略的,难以满足一些复杂的搜索需求。编写一个搜索引擎是一个大工程,好在 django-haystack 这款第三方 app 为我们完成了全部工作。使用它我们可以实现更加复杂的搜索功能,比如全文检索、按搜索相关度排序、关键字高亮等等类似于百度搜索的功能,功能十分强大。当然其使用也会复杂一些,下一篇教程将向大家介绍 django-haystack 结合 Elasticsearch 搜索引擎的使用方法。
Last updated