
会员
自己动手写搜索引擎
更新时间:2018-12-28 22:52:39
最新章节:参考资料开会员,本书免费读 >
本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
上架时间:2009-12-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
最新上架
- 会员
Python高级编程
本书是一部系统讲述Python编程语言与编程方法的案例化教程。全书共分为9章:第1章为Python编程基础知识;第2章为组合数据类型及使用;第3章为函数及调用规则;第4章为程序设计;第5章为面向对象程序设计方法;第6章为文件操作与异常处理;第7章为Python的GUI设计;第8章为Python绘图方法;第9章为Python网络爬虫。每章都设置了大量应用案例跟踪指导。本书可作为高等学校Python程计算机6.5万字 - 会员
大数据可视化编程和应用
《大数据可视化编程和应用》从基础开始,全面介绍大数据可视化的底层原理和实现框架,并重点讲解一些常用的大数据可视化关键技术,包括Excel图表、TableauDesktop可视化组件、Web的可视化控件、Java可视化控件及Python数据可视化工具。《大数据可视化编程和应用》共分为8章,第1章着重介绍大数据的发展历程,以及在大数据发展背景下数据可视化的概念、可视化技术的使用及可视化的现实意义;第2计算机4.2万字 - 会员
整理优先:小改进,大回报,整洁代码设计指南
本书分为三部分:第1部分介绍代码的整理(微型重构);第二部分讨论如何将整理工作整合到开发工作流程中;第三部分深入探讨什么是软件设计、软件设计如何驱动软件开发和运营成本以及软件开发和运营成本又如何驱动软件设计、投资软件结构与不投资软件结构之间的权衡是什么、我们可以利用哪些经济和人文原则来决定是否以及如何改变软件结构。计算机3.7万字 - 会员
Java程序设计实战案例教程
本书从初学者的角度出发,由浅入深地讲解了Java语言的相关内容。全书共11章,主要介绍了Java开发环境的搭建及其运行机制、基本语法、面向对象编程思想、多线程、常用API、集合、I/O、网络编程等内容,采用通俗易懂的语言阐述抽象的概念,选用生活中密切相关的例子演示知识的运用,通过剖析案例、分析代码含义、解决常见问题等方式进行讲解。书中还添加了许多阶段性任务来模拟程序开发过程,帮助初学者培养良好的编计算机10.6万字 - 会员
HuggingFace自然语言处理详解:基于BERT中文模型的任务实战
本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,也包括具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。本书共14章,分为工具集基础用例演示篇(第1~6章),详细讲解计算机7.7万字 - 会员
数据库管理与开发项目教程:MySQL(微课版·第4版)
本书以MySQL为平台,从数据库管理和开发的角度出发,介绍开发数据库应用系统所需的基础知识和技术。本书将一个贯穿全书的数据库应用系统开发实例“学生信息管理系统”融入各项目,将每个项目分解成若干任务,使读者逐步学会创建、管理、开发数据库,并掌握使用SQL进行程序设计的编程思想和技术。本书内容由浅入深,由实践到理论,再从理论到实践,通过任务驱动的方式将理论与实践密切结合,体现了高职高专和应用型本科教育计算机12.6万字 - 会员
CPU眼里的C/C++
全书共6章,第1章:介绍本书所使用到的主要工具和一些需要心里有数的预备知识;第2章:解析最简单、常用的基础语法,帮助读者适应本书的节奏;第3章:为进阶知识,会从CPU、操作系统的角度,深入分析函数的工作原理和实现细节;第4章:解析经典的C++语法,背后的实现逻辑,并介绍面向对象的编程思想及优缺点;第5章:讨论跟操作系统强相关的软件技术,会将所有章节的内容贯穿起来,初步形成一个现代操作系统的运作模型计算机9万字 - 会员
Java+OpenCV高效入门
OpenCV作为一个应用广泛的开源计算机视觉库,正在受到越来越多的关注。目前OpenCV的各类教程基本上以Python和C++为主,基于Java的OpenCV书籍则少之又少,本书旨在弥补这一空白。本书共13章,前4章是基础部分,包括OpenCV概述和安装配置、数字图像基础及图像基础操作等内容;第5到11章则包括了图像的几何变换、图像平滑、形态学操作、直方图、边缘检测与轮廓、霍夫变换、特征点检测和匹计算机6.9万字 - 会员
Docker与Kubernetes容器虚拟化技术与应用
Docker是目前流行的容器平台。作为开发、发布和运行应用程序的开放平台,Docker为快速发布、测试和部署应用程序提供了一整套技术和方法。《Docker与Kubernetes容器虚拟化技术与应用》主要围绕容器生态体系中的核心组件Docker和Kubernetes展开,介绍了容器的组成及相关概念、容器系统架构和运行原理,重点剖析了Docker和Kubernetes两大工具的核心概念、组成和工作原理计算机9.6万字