商品搜索——输入联想|智能提示探索

商品搜索——输入联想|智能提示探索

结合淘宝、京东、一号店输入联想得出如下猜测结果(当然,这些只是根据尝试的猜测,毕竟没有经验,不清楚具体实现,如果有做过这一块的猿友,希望可以评论指点下,非常感谢):

(1)是否识别拼音?如果可以识别拼音,是否可以拼音纠错?拼音能识别拼音首字母?
淘宝、京东、一号店都可以识别拼音,如shouji,可以识别成手机。
淘宝、京东、一号店都不能进行拼音纠错,如输入souji并不能识别为手机。
对于首字母识别,京东做得比较好,百度和一号店做得效果比较差。

这里写图片描述

这里写图片描述

这里写图片描述

综上,我们实现拼音识别,但不进行拼音纠错,首字母识别可以考虑实现,排序逻辑可能比较复杂。

(2)在提示中,京东是有进行统计如果根据提示关键词搜索会有多少个结果?
京东有,淘宝和一号店没有。那么到底淘宝和一号店有没有初步根据关键字搜索,统计各个推荐到底可以查询到多少数据呢?然后对查询不到的数据的进行过滤?
事实上肯定有的。
因此我们也不是乱推荐,并不是说只要以前被查询过的关键字就推荐出来。需要利用关键字搜索一下是否有查询结果。

这里写图片描述

这里写图片描述

这里写图片描述

(3)能否识别为分类
淘宝、京东、一号店都可以识别分类,淘宝和一号店推荐的时候有提供分类让你进一步选择。

这里写图片描述

我们再搜索结果里面可以入京东一样,锁定分类。但是输入推荐,采用京东的模式,即便关键字为分类也不会提供让其进一步选择。因为我们的类目还不完整。

(4)推荐内容是否一定包含输入内容的每一个字?
京东是已不定的,而淘宝和一号店是必须包含输入内容的每一个字的。
而京东不需要包含每一个字的策略就是:重后租个抛弃,直到有推荐结果为止。
我们采用京东的策略。

这里写图片描述

这里写图片描述

这里写图片描述

(5)推荐内容包含输入内容,顺序是否不可变化?是否有进行分词?
我们分别淘宝京东都输入“华为手机”和“手机华为”,如果有进行分词的话,应该会分词为“手机”和“华为”,如果顺序不影响的话,那么推荐结果应该是一样的,或者几乎一样。

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

根据结果来看,应该是没有进行分词,所以推荐跟词的顺序是有关的。

(6)输入推荐是否有参考个人历史搜索,还是只基于大众历史搜索记录?

从下图来看,应该都有记录用户的搜索行为。初步估计应该是用户搜索应该有进行参与排序。
不过如果将用户搜索行为都记录下来,那么会涉及大数据。如果使用大数据技术可以让用户历史搜索参与排序,否则先不考虑。

这里写图片描述

这里写图片描述

这里写图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/2274.html原文链接:https://javaforall.net

(0)
上一篇 2020年11月12日 上午9:20
下一篇 2020年11月12日 上午9:20


相关推荐

  • ThinkPHP6.0 扩展类库目录(extend)

    ThinkPHP6.0 扩展类库目录(extend)本文转自辰风沐阳的 ThinkPHP6 0 扩展类库目录 extend 框架根目录下的 extend 目录称为扩展类库目录 用于存放一些自定义的类 只要符合自动加载的规范 命名空间 类名 文件名 就可以拿来直接使用 1 extend 目录的直接子内容假设在 extend 目录下创建一个 Upload php 文件 如果是 extend 目录的直接子内容则不需要添加命名空间 phpclassUplo 此时可以在控制器中直接使用 Upload 类 特别注意

    2026年3月18日
    2
  • java判断文件是否为图片格式_java读取图片流

    java判断文件是否为图片格式_java读取图片流前言Java检查文件类型有几种方法:1.判断文件后缀名Stringextension="";inti=fileName.lastIndexOf(‘.’);if(i>0){extension=fileName.substring(i+1);}//…if("jpg".equal

    2025年9月14日
    11
  • ODT珂朵莉树「建议收藏」

    ODT珂朵莉树「建议收藏」珂朵莉树の由来珂朵莉树(或称ODT(OldDriverTree老司机树))这毒瘤算法由CodeForces-896CWillem,ChthollyandSeniorious的正解衍化而来由于其骗分暴力的非正统算法思想虽然很多时候在随机数据下跑时不错但切记这只是骗分暴力,时间复杂度上并不正确什么时候用珂朵莉树珂朵莉树一般用来解决本来应当由线段树解决的区间类问题而使…

    2025年10月16日
    4
  • hadoop hdfs命令_hadooplinux命令

    hadoop hdfs命令_hadooplinux命令概述所有的HDFS命令都调用bin/hdfs脚本文件,如果运行hdfs脚本没有带任何参数的话,则打印所有命令的描述。 使用:hdfs[SHELL_OPTIONS]COMMAND[GENERIC_OPTIONS][COMMAND_OPTIONS]Hadoop是一个参数解析框架,采用解析泛型选项以及运行类。命令参数 描述 –config–loglevel …

    2022年10月4日
    4
  • 根据/proc/partitions获取插入的U盘设备名称

    根据/proc/partitions获取插入的U盘设备名称1 在/proc/partitions中存放着U盘的设备名称,如sda,sdb2等,以sd开头。major主设备号,比如一个U盘有3个分区,主设备名为sda,major为8,分区的major也为8,minor则为分区号,sda1,sda2,minor值为1,2sda的minor为0,name即为设备名,连接/dev./设备名,就可以挂载到一个目录。blocks表示物理设备逻辑块

    2022年6月26日
    34
  • 【并发编程】CPU cache结构和缓存一致性(MESI协议)

    【并发编程】CPU cache结构和缓存一致性(MESI协议)一 cachecpucach 已经发展到了三级缓存结构 基本上现在买的个人电脑都是 L3 结构 1 cache 的意义为什么需要 CPUcache 因为 CPU 的频率太快了 快到主存跟不上 这样在处理器时钟周期内 CPU 常常需要等待主存 浪费资源 所以 cache 的出现 是为了缓解 CPU 和内存之间速度的不匹配问题 结构 cpu gt cache gt memory

    2026年3月20日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号