c# List去重

c# List去重需求:对List集合中的元素去重。实现:有三种方式可以使用-使用Linq中distinct()方法-借助hashset-使用for循环遍历,这种方法在数据量大时,运行速度比较慢代码示例使用distinct()//使用distinct()List<string>lst1=newList<string>(){“as”,”lio”,”sdrf”,”asd”,”lio”};varr.

大家好,又见面了,我是你们的朋友全栈君。

  1. 需求 : 对List集合中的元素去重。
  2. 实现: 有三种方式可以使用
    – 使用Linq中distinct()方法
    – 借助hashset
    – 使用for循环遍历,这种方法在数据量大时,运行速度比较慢

代码示例

  • 使用distinct()

  //使用distinct()
  List<string> lst1 = new List<string>() 
  { 
    "as", "lio", "sdrf", "asd", "lio" };
            var  reslst =lst1.Distinct().ToList();
  • 使用hashset

 public static List<T> RemoveT<T>(List<T> items)
        { 
   
            HashSet<T> set = new HashSet<T>();

            var res = new List<T>();//返回

            for (int i = 0; i < items.Count; i++)
            { 
   
                if (!set.Contains(items[i]))
                { 
   
                    set.Add(items[i]);
                    res.Add(items[i]);
                }
            }
            return res;
        }
  • 使用for-loop

 public  static List<string> ForLoopRemove(List<string> items)
        { 
   
            List<string> output = new List<string>();
            for (int i = 0; i < items.Count; i++)
            { 
   
                bool flag = false;
                //每个元素都与其他这个元素前面的比较,如果前面没有,则添加,否则不添加
                for (int z = 0; z < i; z++)
                { 
   
                    if (items[z] == items[i])
                    { 
   
                        flag = true;
                        break;
                    }
                }
                if (!flag)
                { 
   
                    output.Add(items[i]);
                }
            }
            return output;
        }

测试三种方式的运行速度
代码示例

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;

namespace ConsoleApp2
{ 
   
    class Program
    { 
   
        static void Main(string[] args)
        { 
   
            //list 去重,三种方法
            for (int test = 0; test < 3; test++)
            { 
   
                // 获取测试数据
                var testData = GetTestData(test);
                var max = testData.Item3;///执行次数

                var s1 = Stopwatch.StartNew();
                for (int i = 0; i < max; i++)
                { 
   
                    // 方法 1: use Distinct.
                    var unique = testData.Item2.Distinct().ToList();
                }
                s1.Stop();
                var s2 = Stopwatch.StartNew();
                for (int i = 0; i < max; i++)
                { 
   
                    // 方法 2: use HashSet.
                    var unique = Method.RemoveT(testData.Item2);
                }
                s2.Stop();
                var s3 = Stopwatch.StartNew();
                for (int i = 0; i < max; i++)
                { 
   
                    // 方法 3: use nested for-loop.
                    var unique = Method.ForLoopRemove(testData.Item2);
                }
                s3.Stop();
                // 打印信息.
                Console.WriteLine(testData.Item1);
                //调用时间.
                Console.WriteLine(s1.Elapsed.TotalMilliseconds + " ms");
                Console.WriteLine(s2.Elapsed.TotalMilliseconds + " ms");
                Console.WriteLine(s3.Elapsed.TotalMilliseconds + " ms");
            }

            //结论: 当数据量少时,直接使用for-loop 遍历数据即可;
            //当数据量大时,使用hashSet 或者时linq的distinct()方法
            List<string> testLst=  GetListWithDuplicates(100, 20);
            Method.RemoveRepeat(testLst);

            //实现按照对象的某个字段去重。

            List<Student> lst = new List<Student>();
            lst.Add(new Student { 
    No = 23, name = "李磊" });
            lst.Add(new Student { 
    No = 45, name = "david" });
            lst.Add(new Student { 
    No = 12, name = "lily" });

            lst.Add(new Student { 
    No = 23, name = "李磊" });
            lst.Add(new Student { 
    No = 45, name = "david" });
            lst.Add(new Student { 
    No = 72, name = "lily" });

            var res=  lst.Distinct(new ItemEqualityComparer());
            foreach (var item in res)
            { 
   
                Console.WriteLine($"distinct: {item.No}---{item.name}");
            }


            Console.ReadKey();
        }

      

        /// <summary>
        /// 生成测试数据,最后的一个参数,表示方法被调用的次数
        /// </summary>
        /// <param name="test"></param>
        /// <returns></returns>
        static Tuple<string, List<string>, int> GetTestData(int test)
        { 
   
            // Tuple contains description string, list, the unique element count, and iterations for test.
            switch (test)
            { 
   
                default:
                case 0:
                    return new Tuple<string, List<string>, int>("10 ELEMENT LIST, 0 DUPLICATES",
                        GetListWithDuplicates(10, 0),
                        100000);
                case 1:
                    return new Tuple<string, List<string>, int>("300 ELEMENT LIST, 100 DUPLICATES",
                        GetListWithDuplicates(200, 100),
                        1000);
                case 2:
                    return new Tuple<string, List<string>, int>("3000 ELEMENT LIST, 1000 DUPLICATES",
                        GetListWithDuplicates(2000, 1000),
                        100);
            }
        }

        public static List<string> GetListWithDuplicates(int len, int repeatNum)
        { 
   
            const string duplicateString = "bird";
            List<string> result = new List<string>();
            for (int i = 0; i < len; i++)
            { 
   
                result.Add("cat" + i);

                if (repeatNum > 0)
                { 
   
                    result.Add(duplicateString);
                    repeatNum--;
                }
            }

            for (int i = 0; i < repeatNum; i++)
            { 
   
                result.Add(duplicateString);
            }
            return result;
        }
    }


    /// //
  #region 按照对象的某个字段去重
    public class Student
    { 
   
        public string name;
        public int No;
        
    }
    /// <summary>
    /// 按照学号判断
    /// </summary>
    public class ItemEqualityComparer : IEqualityComparer<Student>
    { 
   
        public bool Equals(Student x, Student y)
        { 
   
            return x.No == y.No;
        }

        public int GetHashCode(Student obj)
        { 
   
            return obj.No.GetHashCode();
        }
    }
    #endregion

}

调用方法的封装

using System;
using System.Collections.Generic;


namespace ConsoleApp2
{ 
   
    public static class Method
    { 
   

        /// <summary>
        /// 使用两个循环,但是在数据量大时,这种方法比较慢
        /// </summary>
        /// <param name="items"></param>
        /// <returns></returns>
        public  static List<string> ForLoopRemove(List<string> items)
        { 
   
            List<string> output = new List<string>();
            for (int i = 0; i < items.Count; i++)
            { 
   
                bool flag = false;
                //每个元素都与其他这个元素前面的比较,如果前面没有,则添加,否则不添加
                for (int z = 0; z < i; z++)
                { 
   
                    if (items[z] == items[i])
                    { 
   
                        flag = true;
                        break;
                    }
                }
                if (!flag)
                { 
   
                    output.Add(items[i]);
                }
            }
            return output;
        }

        /// <summary>
        /// 使用hashset去重
        /// </summary>
        /// <param name="lst"></param>
       public  static void RemoveRepeat(List<string> lst)
        { 
   
            Console.WriteLine("intput :" + lst.Count);

            HashSet<string> set = new HashSet<string>();
            foreach (string item in lst)
            { 
   
                set.Add(item);
            }
            Console.WriteLine(set.Count);

            lst.Clear();
            lst.AddRange(set);
            Console.WriteLine("outPut: "+lst.Count);
        }

        /// <summary>
        /// 使用hashset去重的泛型方法
        /// </summary>
        /// <param name="items"></param>
       public static List<T> RemoveT<T>(List<T> items)
        { 
   
            HashSet<T> set = new HashSet<T>();

            var res = new List<T>();//返回

            for (int i = 0; i < items.Count; i++)
            { 
   
                if (!set.Contains(items[i]))
                { 
   
                    set.Add(items[i]);
                    res.Add(items[i]);
                }
            }
            return res;
        }

    }
}

  • 代码中,也提供了对象集合按照对象的某个字段进行去重的方法。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/141341.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月9日 上午11:20
下一篇 2022年5月9日 上午11:20


相关推荐

  • SCSA 模拟题 知识点 (一)

    SCSA 模拟题 知识点 (一)SCSA模拟题知识点(一)1、CIA三原则基本是安全业界的主流共识,CIA原则是:完整性、可用性、机密性2、【AC】关于流量管理功能说法正确的是:流控可以基于用户进行流控3、【AC】数据包如果经过二层交换机转发后,这个数据包的源MAC不会发生变化,如果经过三层交换机路由转发后,源MAC会发生变化4、【SSL】私有用户同一时间只允许一台PC使用;共有用户允许多人使用,在同一时间内同时登录SSLVPN;私有用户可以在线修改登录密码、DKEY的PIN码、手机号码等5、【EDR】病毒..

    2022年6月20日
    34
  • BP神经网络原理及实现

    BP神经网络原理及实现BP神经网络原理经典的BP神经网络通常由三层组成:输入层,隐含层与输出层.通常输入层神经元的个数与特征数相关,输出层的个数与类别数相同,隐含层的层数与神经元数均可以自定义.每个神经元代表对数据的一次处理:每个隐含层和输出层神经元输出与输入的函数关系为:其中Wij表示神经元i与神经元j之间连接的权重,Oj代表神经元j的输出,sigmod是一个特殊的函数用于将任意实数映射到(0,1)区间.上文中的sigmod函数称为神经元的激励函数(activationfunction),除了sig

    2022年7月20日
    16
  • 最小化类和成员的訪问能力

    最小化类和成员的訪问能力

    2022年1月18日
    59
  • tfs安装教程_2010版cad安装教程

    tfs安装教程_2010版cad安装教程(说明:略过IIS6.0、SQLServer和SharePoint的安装)(说明:需要注意是32位版本还是64位版本)1、配置SQLServer。打开SQLServerConfigurationManager,左边树中展开SQLServer网络配置-MSSQLSERVER的协议,确保右边的“TCP/IP”和“命名管道”全都启用,如果已经禁用则启用,如下图示: 2、

    2026年2月20日
    3
  • spring cloud面试题_javaspring面试题

    spring cloud面试题_javaspring面试题Tags:JavaEE,Spring,面试题发表时间:2014-11-2915:03:53原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。比如:转自:Su的技术博客 原文地址:https://blog.verysu.com/article/119 这些Spring面试题是从尚硅谷http://www.atguigu.c…

    2022年10月14日
    3
  • 第1章:初识 Coze 平台

    第1章:初识 Coze 平台

    2026年3月12日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号