数据服务器搭建

上传人:ni****g 文档编号:464808044 上传时间:2022-10-31 格式:DOCX 页数:8 大小:55.23KB
返回 下载 相关 举报
数据服务器搭建_第1页
第1页 / 共8页
数据服务器搭建_第2页
第2页 / 共8页
数据服务器搭建_第3页
第3页 / 共8页
数据服务器搭建_第4页
第4页 / 共8页
数据服务器搭建_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《数据服务器搭建》由会员分享,可在线阅读,更多相关《数据服务器搭建(8页珍藏版)》请在金锄头文库上搜索。

1、个人信息网络数据库一搜索引擎数据服务器搭建搜索引擎数据服务器框架图:顼政航备器堡:|队数蓝听熟而定朋查间心进行刨建搜索成引七据遭常剧 ,Mysq5.1.62只进行协政操作 INSLRT/DLLLTL.- UPDATEWeb !i iffliiid ShpfriK API iJl-JS 案U擎既拆器-.:& 泞搜卖鞍据,集郡 将数据化灼品征返 I,.到将曲从数据时器L Myw|J5.1.62 富听33MPHP5.3.13+ Apache 2.2 +CeiitOS 6.4用到的软件:1. Coreseek / Sphinx: Sphinx支持高速建立索引(可达10 MB/秒,而Lucene建立索引

2、的速度是 1.8MB/秒)高性能搜索(在2-4 GB的文本上搜索,平均0.1秒内获得结果)高扩展性(在单一 CPU上,实测最高可对100GB的文本建立索引,单一 索引可包含1亿条记录)支持分布式检索支持基于短语和基于统计的复合结果排序机制支持任意数量的文件字段(数值属性或全文检索属性)支持不同的搜索模式(“完全匹配”,“短语匹配”和“任一匹配”)支持作为Mysql的存储引擎 Coreseek是在sphinx的基础上对中文进行分词的软件包2. LibMMSeg:中文分词3. Mysql:存贮数据4. PHP: 程序使用PHP写的5. Apache: Web Server安装软件前的准备:1. 设

3、置服务器网络2. 安装相关软件包yum -y install gcc g+ gcc-c+ libjpeg libjpeg-devel libpng libpng-devel freetype freetype-devel libxml2 libxml2-devel zlib zlib-devel glibc glibc-devel glib2 glib2-devel bzip2 bzip2-devel ncurses ncurses-devel curl curl-devel e2fsprogs e2fsprogs-devel krb5 krb5-devel libidn libidn-dev

4、el openssl openssl-devel openldap openldap-devel nss_ldap openldap-clients openldap-servers patch libtool automake imake mysql-devel expat-devel安装软件包:1.安装 MySQL+SphinxSEtar zxvf mysql-5.1.62.tar.gztar zxvf coreseek-4.1-beta.tar.gzcp -r coreseek-4.1-beta/csft-4.1/mysqlse/ mysql-5.1.62/storage/sphinxc

5、d mysql-5.1.62./BUILD/autorun.sh./configure -prefix=/usr/local/mysql/ -enable-assembler -with-extra-charsets=complex -enable-thread-safe-client -with-big-tables -with-readline -with-ssl -with-embedded-server -enable-local-infile -with-plugins=partition,innobase,myisammrg,sphinx makemake install。省略若干

6、配置步骤,和平时配置MySQL没什么两样。安装完成启动MySQL后查看sphinx存储引擎是否安装成功在mysql命令行下执行show engines;如果出现如下图红色方框内的信息说明SphinxSE已经安装成功!+-+1Engine| Support | Comment| Transactions | XA | Sa_1_j11TTTTT1MRG_MYISAM | YES| Collection of identical My I SAM tables| NO| NO | NO1CSV-| YES| CSV storage engine| NO| NO | NO1MyISAM| DEFAU

7、LT | Default engine as of MySQL 323 with great performance| NO| NO | NO1.TnncDR| YES|rcTtf-l evel locking, and foreign keys | YES| YES | YE:SPHINX| YES| Sphinx storage engine 0 . 9 .司| NO| NO | NO1MEMORY| YES| Hash basedr, useful for tensorary tables | NO| NO | NO4-+rows in set (0.00 sec)2.安装Sphinx全

8、文检索服务器Sphinx默认不支持中文索引及检索,以前用Coreseek的补丁来解决,目前 Coreseek不单独提供补丁文件,而基于sphinx开发了 Coreseek全文检索服务器, Coreseek应该是现在用的最多的sphinx中文全文检索,它提供了为Sphinx设计 的中文分词包LibMMSeg包含mmseg中文分词,其实coreseek-3.2.14.tar.gz 中已经包含了 sphinx,前面安装SphinxSE时也可以使用这个压缩包里的 mysqlse。下边是安装过程:安装 autoconftar zxvf autoconf-2.64.tar.gzcd autoconf-2.

9、64./configure 一prefix=/usrmakemake installcd .安装 Coreseektar zxvf coreseek-3.2.14.tar.gzcd coreseek-3.2.14cd mmseg-3.2.14/./bootstrap./configure -prefix=/usr/local/mmseg3makemake installcd ./csft-3.2.14/sh buildconf.sh./configure -prefix=/usr/local/coreseek -without-python -without-unixodbc-with-mms

10、eg -with-mmseg-includes=/usr/local/mmseg3/include/mmseg/-with-mmseg-libs=/usr/local/mmseg3/lib/ -with-mysql -host=arm(不支持bigint)./configure -prefix=/usr/local/coreseek -without-python -without-unixodbc-with-mmseg -with-mmseg-includes=/usr/local/mmseg3/include/mmseg/-with-mmseg-libs=/usr/local/mmseg3

11、/lib/ -with-mysql -host=arm -enable-id64 (支持 bigint )makemake install酉己置 Sphinx.conf, 进入 cd /usr/local/coreseek/etc example.sql sphinx.conf.dist sphinx-min.conf.dist其中example.sql是示例sql脚本我们将其导入到数据库中的test数据库中作为测试数据(会创建两张表documents和tags)vi sphinx.conf输入以下内容source src1(type=mysqlsql_host=localhostsql_us

12、er=rootsql_pass=12345678sql_db= testsql_port = 3306 # optional, default is 3306 sql_sock = /tmp/mysql.sock sql query pre = SET NAMES utf8 sql_querySELECT id, group_id, date_added, title, content FROM documents sql_attr_uint sql_attr_timestamp sql_query_infoid=$idindex test1(source path docinfo chars

13、et_type mlock=0morphology=nonemin_word_len = 1 html_strip=0charset_dictpath ngram_lenindexer(mem_limitUNIX_TIMESTAMP(date_added) ASgroup_id=date_added=SELECT * FROM documents WHEREsrc1/usr/local/coreseek/var/data/test1=externzh_cn.utf-8/usr/local/mmseg3/etc/=032Msearchd(port= 9312log=/usr/local/core

14、seek/var/log/searchd.log query_log=/usr/local/coreseek/var/log/query.log read_timeout=5max_children=30pid_file=/usr/local/coreseek/var/log/searchd.pid max_matches=1000seamless_rotate=1preopen_indexes=0unlink_old说明:代码段source src1*代表数据源里面主要包含了数据库的配置信息, srcl表示数据源名字,可以随便写。代码段index test1(*代表为哪个数据源创建索引,与s

15、ource *是成 对出现的,其中的source参数的值必须是某一个数据源的名字。其他参数可以查看手册,这里不再赘述。生成索引/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf -all其中参数-all表示生成所有索引当然也可以是索引的名字例如:/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/ sphinx.conf test1执行后可以在/usr/local/coreseek/var/data目录中看到多出一些文件,是 以索引名为文件名的不同的扩展名的文件在

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号