R语言批量生成CaseWhen的解决方案

R语言批量生成CaseWhen的解决方案R语言case_when批量生成自定义函数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

近期写R代码,经常用dplyr::case_when结合stringr::str_detect进行条件判断。

痛点:判断条件可能会改或增删,全写在case_when里,代码冗余且不利于复制和维护,stackoverflow找了一圈,没发现好的解决方案,干脆自己写了一个通用代码以自动生成批量case_when判断。

先上代码:

allCaseWhen <<- function(x,pattern,result){ 
   
  x1 <- str_flatten(map2_chr(result,pattern,~str_glue("str_detect(x,'{.y}')~'{.x}',")))
  x2 <- str_glue("function(x) case_when({x1})")
  fx <- eval(parse(text=x2))
  fx({ 
   { 
   x}})}

需要用到的包:

  library(purrr)
  library(stringr)

使用示例:

初始表tibble(fruit=stringr::fruit)
在这里插入图片描述
想实现字母a开头为’starts with a’,字母e结尾为’ends with e’ 等若干条件。结果如下图:
在这里插入图片描述
单纯用case_when,需要写成

tibble(fruit=stringr::fruit) %>% 
  mutate(
    category=case_when(
      str_detect(fruit,'^a')~'starts with a',
      str_detect(fruit,'e$')~'ends with e',
      str_detect(fruit,'o')~'contains o',
      str_detect(fruit,'(an)|(ch)')~'contains an or ch'
    )
  )

如果有其他表有类似的应用,你得把条件抄一遍,实在繁琐。

用改良后的allCaseWhen会简单很多,两步解决:

1. 表格形式列出条件

conditions <- 
	tribble(
	  ~pattern,~result,
	  '^a','starts with a',
	  'e$','ends with e',
	  'o','contains o',
	  '(an)|(ch)','contains an or ch'
	)

或者写在Excel里,
在这里插入图片描述
然后复制单元格,用conditions <- clipr::read_clip_tbl()读进R在这里插入图片描述

2. allCaseWhen走起

tibble(fruit=stringr::fruit) %>% 
  mutate(
    category=
      allCaseWhen(fruit,
                  conditions$pattern, #读取条件
                  conditions$result  #返回结果
                  )
  )

搞定。

函数的核心依然是case_when,条件为真即停止,所以效率上没有损失。

如果想改条件,在conditions里放肆增删改,改完再跑一遍allCaseWhen即可。
没有写默认条件,因为没必要,可以用coalesce()处理。

以上。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/196786.html原文链接:https://javaforall.net

(0)
上一篇 2025年9月20日 上午8:43
下一篇 2025年9月20日 上午9:15


相关推荐

  • spring事务管理全解析

    spring事务管理全解析

    2021年5月9日
    99
  • linux查看cuda、cudnn等软件版本的命令

    linux查看cuda、cudnn等软件版本的命令nvcc V 或者 CUDA cat usr local cuda version txtcudnn cat usr local cuda include cudnn h grepCUDNN MAJOR A2

    2026年3月26日
    2
  • Win10自动修复无法开机【完美解决】

    Win10自动修复无法开机【完美解决】Windows10 操作系统于 2015 年 7 月 29 日正式发布 此后 win10 也就成了新上市的笔记本电脑或者台式机电脑的预装操作系统 win10 系统给我们带了全新的体验 当然也带来了一定的烦恼 就拿 win10 自动修复这个功能来说 玩过 win10 的朋友 多数人都遇到过 win10 一开机就自动修复 而且开机自动修复失败 然后电脑开机卡在自动修复 只能重启 再自动修复 再重启 始终无法开机 我的一个朋

    2026年3月17日
    1
  • idea 选中代码生成方法

    idea选中代码生成方法非常好用这边给大家送上显示GIF快捷键:Ctrl+Alt+M觉得本文章对您有帮助,那么可以选择打赏。打赏多少,您高兴就行,谢谢您对我的支持!~(@^_^@)~微信扫一扫…

    2022年4月8日
    162
  • pycharm的配置_pycharm添加编译器

    pycharm的配置_pycharm添加编译器一、Pycharm简介与安装简介Pycharm与VScode一样,都可以作为python的可视化IDE,功能很强大,可以帮助我们提高编程的效率。包括调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制等。安装作为一个穷孩子,建议还是安装社区免费版,因为社区免费版与专业版无差别,功能是齐全的。安装地址在这里!二、Pycharm配置作为python编程的ID…

    2022年8月28日
    3
  • python计算双色球数字概率_python绘制双色球走势图

    python计算双色球数字概率_python绘制双色球走势图本次将进行下期双色球号码的预测,想想有些小激动啊。代码中使用了线性回归算法,这个场景使用这个算法,预测效果一般,各位可以考虑使用其他算法尝试结果。#!/usr/bin/python#-*-coding:UTF-8-*-#导入需要的包importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt

    2022年8月21日
    9

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号