lavorange

再看快速排序（QuickSort）

快速排序是一个十分伟大的算法，作为再一次的学习，写一写快排以及和快排相关的问题。

1.基本的快速排序方法。

快速排序（QuickSort）的基本思想是：通过一趟排序将待排序记录分割成独立的两部分，其中一部分记录的关键字均比另一部分记录的关键字小，则可以分别对这两部分记录继续进行排序，以达到整个序列有序的目的。

快速排序的基本过程在此不做赘述，主要展示代码以及和快排相关的问题。当然是先快排有很多种方法很代码，基本程序的框架是一样的。

代码：

#include<iostream>

using namespace std;

template <typename T>
void QuickSort(T *a,int low , int high)
{
	int pivot ;
	if(low < high)
	{
		pivot = Partition(a,low,high);//算出枢轴将数组a以pivot一分为二 
		QuickSort(a,low,pivot-1);     //对低子表递归排序 
		QuickSort(a,pivot+1,high);    //对高子表递归排序 
	}
}

/*Partition函数要做的，就是先选取当中的一个关键字，比如选择第一个关键字50，然后将它
放到某一个位置，使得它左边的 值都比它小，右边的值比它大。*/ 
template <typename T>
int Partition(T *a,int low,int high)
{
	int pivot_key = a[low];//用子表的第一个记录作为枢轴记录 

    /*从表的两端交替向中间扫描*/ 
	while( low < high )
	{
        /*从后向前扫描*/
		while( low<high && a[high]>=pivot_key )
		{
			high--;
		}
		a[low] = a[high];
        /*从前向后扫描*/
		while( low<high && a[low]<=pivot_key )
        {
		    low++;
		}
		a[high] = a[low];
	}
	a[low] = pivot_key;
	return low; //返回枢轴所在的位置 
}

template <typename T>
void print(T *a , int len)
{
	for(int i=0;i<len;i++)
	{
		cout<<a[i]<<" ";
	}
	cout<<endl;
}

int main()
{
	int a[] = {50,10,90,30,70,40,80,60,20};
	char b[] = {'e','a','i','c','g','d','h','f','b'};

	QuickSort( a,0,sizeof(a)/sizeof(a[0])-1 );
	cout<<"After QSort:"<<endl; 
	print( a,sizeof(a)/sizeof(a[0]) );
	QuickSort( b,0,sizeof(b)/sizeof(b[0])-1 );
    cout<<"After QSort:"<<endl;
	print( b,sizeof(b)/sizeof(b[0]) );
    system("pause");
	return 0;
}

结果：

2.快排的优化

2.1优化选取枢轴

三数取中法：取三个关键字先进性排序，将中间数作为枢轴，一般是曲左端、右端和中间三个数。这样至少中间数一定不会是最小或者最大的数，从个概率上来讲，取三个数均为最小或者最大数的可能性微乎其微，因此中间数位于较为中间的值的可能性就大大提高了。因此可以在Partition函数的第一行代码(int pivot_key = a[low];)前加入如下代码：

int m = ( (high - low) >> 1 ) + low;//计算数组中间元素的下标
if( a[low] > a[high]) 
{
    swap(a,low,high);
}
if( a[m] > a[high] )
{
    swap(a,high,m);
}
if( a[m] > a[low] )
{
    swap(a,m,low);
}
/*此时a[low]已经为整个序列左中右三个关键字的中间值*/

int pivot_key = a[low];
.... </span>

2.2优化小数组的排序方案

快排适合于解决非常大的数组的排序问题。那么相反的情况下，如果数组非常小，其实快排反而不如插入排序来的效果更好（直接插入排序是简单排序中性能效果最好的）。因为快排用了很多递归操作，在大量数据排序时，算法优势胜过递归影响，但如果只有几个记录，可以选择插入排序。

2.3优化递归操作

递归对性能是有一定影响的，Quicksort函数在其尾部有两次递归操作。如果待排序的序列划分极端不平衡，递归深度将趋近于n，而不是平衡时的log2n，这就不仅仅是速度快排的问题了。栈的大小是很有限的，每次递归调用都会耗费一定的栈空间，函数的参数越多，每次递归耗费的空间也越多。因此如果能够减少递归，将会大大提高性能。于是对QuickSort实施尾递归优化。

template <typename T>
void QuickSort1(T *a,int low , int high)
{
	int pivot ;
	<strong>while</strong>(low < high)
	{
		pivot = Partition(a,low,high);//算出枢轴将数组a以pivot一分为二 
		QuickSort1(a,low,pivot-1);     //对低子表递归排序 
		<strong>low = pivot + 1 ;             //尾递归 </strong>
	}
}

当我们将if改成while后，因为第一次递归以后，变量low就没有用处了，所以可以将pivot+1赋值给low，在循环后，来一次Partition(a,low,high)，其效果等同于"QuickSort(a,pivot+1,high)"。结果相同，但因为采用迭代而不是递归的方法可以缩减堆栈深度，从而提高整体性能。关于尾递归，笔者理解的也不是十分透彻，希望读者可以不吝赐教。

3.中位数问题：现在给你n个数，让你找到这n个数的中位数。有哪些方法？（假设n个数可以一次装入到内存中）

方法一：这个n个数是无序的，那么就去将这n个数进行排序，利用快速排序，平均时间复杂度为O(nlogn)，然后用O(1)的时间找到中位数。具体代码就不写了。只是在n很大的情况下，效率非常的低，那么有木有线性复杂度的方法呢？

方法二：快排的变形。我们知道可以通过分治的方法将数组按照枢轴分为两个部分，一个是大于枢轴的部分，另一个是小于枢轴的部分，那么找到中位数就相当于找到枢轴等于(n-1)/2时候对应的数组的值，因此在每次得到一个枢轴值的时候，都和(n-1)/2进行比较，如果小于(n-1)/2，那么就去处理枢轴右面的数组序列；否则处理枢轴左面的数组序列，这样就相当于是一个线性的搜索过程，时间复杂度为O(n)。

而查找中位数也是另外一个问题的具体情况，那就是"The max/min Nth"，数组中第N个最大/最小数的问题，其实也是相当于TopN问题，那么我们下面分析这个问题，并将代码呈上。

4.如何找到数组中最大（小）的第K个数？又如何找到数组中的前K个最大（小）的数，即TopN问题？（为方便讨论，下面都是找到最大的数）

方法一：首先可以使用堆排序

找到第k大的数以及TopK最大的数，可以使用堆排序，建立大顶推，不断的调整，经过k次，就可以找到最大的k个数，第k大的数自然也就得到了。经过k次调整，平均的时间复杂度为O(klogn)。代码在这里就不贴了。重点介绍方法二。

方法二：这种方法类似于3中介绍的方法二，就不再细说，上代码。

#include<iostream>

using namespace std;

template <typename T>
T findTheKthNum(T *a,int low , int high, int nth)
{
	int pivot = Partition(a,low,high);
	if(pivot == nth) return a[pivot];
	else if( pivot > nth ) return findTheKthNum(a,low,pivot-1,nth);
	else return findTheKthNum(a,pivot+1,high,nth);
}

template <typename T>
int Partition(T *a,int low,int high)
{
	int pivot_key = a[low];

	while( low < high )
	{
		while( low<high && a[high]>=pivot_key )
		{
			high--;
		}
		a[low] = a[high];

		while( low<high && a[low]<=pivot_key )
		{
			low++;
		}
		a[high] = a[low];
	}
	a[low] = pivot_key;
	return low;
}

template <typename T>
void print(T *a , int len)
{
	for(int i=0;i<len;i++)
	{
		cout<<a[i]<<" ";
	}
	cout<<endl;
}

int main()
{
	int a[] = {50,10,90,30,70,40,80,60,20};
	char b[] = {'e','a','i','c','g','d','h','f','b'};

	cout<< findTheKthNum( a,0,sizeof(a)/sizeof(a[0])-1 , 4 )<<endl;
	print( a,sizeof(a)/sizeof(a[0]) );

	cout<< findTheKthNum( b,0,sizeof(b)/sizeof(b[0])-1 , 4 )<<endl;
	print( b,sizeof(b)/sizeof(b[0]) );
    system("pause") ;
	return 0;
}

结果：

分析：这段代码就相当于找到了第K大的数，同时左边都是比它小的数，右边都是比它大的数，自然就能知道TopK小（大）的数了。

PS：现在有n个数，不能够一次性的装入到内存中，如何找到TopK大的数？这是一个大数据的算法问题，在此不做具体分了，大概的步骤是先对每个数hash取余到若干文件中，然后对每个文件中的用堆排序或者分治的方法得到最大的K个数，最后将每个文件中最大的K个数归并，得到整体的K个数。

5.最后讲一下C语言的里面的qsort函数以及C++中的sort函数，主要还是讲用法。

5.1.qsort

qsort的定义为：

void qsort(void *base,size_t num,size_t size,int(*compar)(const void*,const void*) );

其中compar为函数指针，需要传递一个函数名来调用该函数，一般这种函数的原型为：

<span style="font-size:14px;">int compar(const void* a , const void *b) 
{
    return ( *(int*)a - *(int*)b );
}</span>

关于函数指针在此就不做过多解释，主要还是写一下qsort的几个用法：

1).对一维数组进行排序：

对一个长为1000的数组进行排序，int a[1000];

qsort( a , 1000 , sizeof(int) , cmp);
int cmp( const void *a , const void *b )
{
        return *(int *)a-*(int *)b;//由大到小排序，return *(int*)b-*(int*)a；
}

2).对二维数组进行排序：

int a[1000][2]；其中按照a[0]的大小进行一个整体的排序，其中a[1]必须和a[0]一起移动交换；

qsort( a , 1000 , sizeof(int)*2 , cmp );
int cmp( const void *a , const void *b )
{
    return ( (int *)a)[0] - ( (int *)b)[0]  ;
}

char a[1000][20]；进行排序：

qsort( a , 1000 , sizeof(char)*20 , cmp );
int cmp( const void *a , const void *b )
{
    return strcmp( (char*)a - (char*)b )  ;
}

3).对结构体进行排序：

①

typedef struct str
{
    char str1[11];
    char str2[11];
}str;
str s[1000];
int cmp(const void *ａ, const void *b)
{
    return strcmp( ((str*)a)->str2 ,  ((str*)b)->str2 );
}
qsort( s , 1000  , sizeof(str) , cmp );

②对结构体进行排序，cmp函数实现了，先对dis从大到小排序，然后在dis相同的情况下，按照cost从大到小进行排序。

typedef struct point
{
    int dis;
    int cost;        
}tPoint ;

tPoint p[10001];

bool cmp(point a,point b)
{
     if(a.dis < b.dis)     
         return true;
     else if(a.dis == b.dis)
         return a.cost<b.cost;
     else return false;
}
sort(p,p+n,cmp);

③用的是qsort，效果应该和②是一样的。

typedef struct point
{
    int dis;
    int cost;        
}tPoint ;
tPoint p[10001];

int cmp_dis(const void *a , const void *b)
{
    if ( ( ((tPoint*)a)->dis ) > ( ((tPoint*)b)->dis ) )  
        return true;
    else if ( ( ((tPoint*)a)->dis ) == ( ((tPoint*)b)->dis ) ) 
        return ( ((tPoint*)a)->cost ) > ( ((tPoint*)b)->cost );
    else 
        return false;
}
 qsort( p,n,sizeof(tPoint),cmp_dis );//sort by dis

4).对double型进行排序：

int cmp( const void *a, const void *b )
{
        return ( (*(double*)a - *(double*)b >0 )?1:-1 ;
}
qsort( s,n,sizeof(int ),cmp );

5).对char*类型字符串进行排序：

以下是摘自stackoverflow的内容，讲的还算清楚。

Suppose I have an array of pointers to char in C:

char *data[5] = { "boda", "cydo", "washington", "dc", "obama" };

And I wish to sort this array using qsort:

qsort(data, 5, sizeof(char *), compare_function);

I am unable to come up with the compare function. For some reason this doesn't work:

int compare_function(const void *name1, const void *name2) { const char *name1_ = (const char *)name1; const char *name2_ = (const char *)name2; return strcmp(name1_, name2_); }

I did a lot of searching and found that I had to use ** inside of qsort:

int compare_function(const void *name1, const void *name2) { const char *name1_ = *(const char **)name1; const char *name2_ = *(const char **)name2; return strcmp(name1_, name2_); }

Then works.

5.2.sort

qsort似乎不能体现出范型编程的优势，而C++中的sort相对来讲更简单易用写。

基本用法参考：http://www.cplusplus.com/reference/algorithm/sort/?kw=sort

关于sort中的第二个版本，定义仿函数来自己定义排序方法中的仿函数理解还是很模糊，根据书上的说法就是：

以sort()为例，其第一版本是以operator<为排序时的元素位置调整依据，第二版本则允许用户指定任何"操作"，务必排序后的两两相邻元素都能令该结果为true。要将这种"操作"当做算法的参数，唯一办法就是先将该"操作"设计为一个所谓的仿函数（就语言层面而言是个class），再以该仿函数产生一个对象，并以此对象作为算法的一个参数。

根据以上陈述，既然函数指针可以达到"将整组操作当做算法的参数"，那又何必有所谓的仿函数呢？原因在于函数指针毕竟不能满足STL对抽象性的要求，也不能满足软件积木的要求--函数指针无法和STL其他组件（如配接器adapter）搭配，产生更灵活的变化。

就是先观点而言，仿函数其实上就是一个"行为类似函数"的对象，为了能够"行为类似函数"，其类别定义中必须自定义（改写，重载）functional call 运算子（operator()）。拥有这样的运算子后，我们就可以在仿函数对象后而加上一对小括号，一次调用仿函数所定义的operator()。下面贴个代码，用到了sort和for_each。

#include<iostream>
#include<vector>
#include<algorithm>

using namespace std;

bool pfunc(int i,int j)
{
    return i < j;
}

class cfunctor
{
public:
    bool operator()(int i,int j)    
    {
         return i < j;    
    }
}mycfunctor;

void pprint(int i)
{
    cout<<i<<" ";
}

class cprint
{
public:
    void operator()(int i)    
    {
        cout<<i<<" ";
    }
}mycprint;

int main()
{
    int a[] = {32,71,12,45,26,80,53,33};
    int b[] = {32,71,12,45,26,80,53,33};
    
    vector<int> vec1( a,a+sizeof(a)/sizeof(a[0]) );
    vector<int> vec2( b,b+sizeof(b)/sizeof(b[0]) );
    
    sort( vec1.begin(),vec1.end(),pfunc );
    sort( vec2.begin(),vec2.end(),mycfunctor );
    for_each(vec1.begin(),vec1.end(),pprint );
    cout<<endl;
    for_each(vec2.begin(),vec2.end(),mycprint);
    cout<<endl;
    
    system("pause");
    return 0;
}

体会一下这个代码，知道怎么用，然后感受一些就行了。

转载请注明：http://blog.csdn.net/lavorange/article/details/38896519

C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
Java8 Stream流的sorted()的排序【正序、倒序、多字段排序】 Tony666688888 java windows 开发语言
针对集合排序，java8可以用Stream流的sorted()进行排序。示例Bean以下我们会使用这个Bean来做示例。publicclassOrder{privateStringweight;privateDoubleprice;privateStringdateStr;//忽略getter、setter、构造方法、toString}字段排序首先是比较器Comparator，形式如下：Compa
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
R语言笔记Day1（排序、筛选以及分类汇总））养猪场小老板
一、排序1、单变量序列排序2、数据表（矩阵）排序二、筛选三、分类汇总一、排序1、单变量序列排序rank、sort和order函数>aa[1]315#rank用来计算序列中每个元素的秩#这里的“秩”可以理解为该元素在序列中由小到大排列的次序#上面例子给出的序列[3,1,5]中，1最小，5最大，3居中#于是1的秩为1，3的秩为2，5的秩为3，(3,1,5)对应的秩的结果就是(2,1,3)>rank(a
2025年海外短剧CPS分销系统开发：技术架构与商业化实战指南
一、市场爆发：万亿级赛道的结构性机遇2025年海外短剧市场迎来指数级增长，SensorTower数据显示，仅第一季度应用内购收入就达7亿美元，全年预计突破45亿美元。美国贡献49%收入，东南亚以9%增速成为新兴增长极。这种爆发式增长源于三大驱动力：用户行为变迁：全球短视频用户突破20亿，微短剧月活用户仅8000万，渗透率不足10%，存在11倍增长空间技术赋能创新：AI生成内容（AIGC）降低制作成
Linux 如何统计系统上各个用户登录（或者登出）记录出现的次数？我是唐青枫 Linux linux 服务器网络
命令last|grep-v"^$"|awk'{print$1}'|sort-nr|uniq-c逐段解析last从/var/log/wtmp（或者对应的系统登录日志）中读取并列出最近的登录、重启、关机等记录。每行开头通常是用户名，例如：alicepts/0192.168.1.5TueJul2210:15stillloggedinbobtty1MonJul2109:00-17:00(08:00)reb
《剑指offer》-算法篇-排序小新学习屋数据结构与算法算法 leetcode 职场和发展数据结构与算法
题目最小的K个数数组中的逆序对代码实现最小的K个数题目描述：输入n个整数，找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字，则最小的4个数字是1,2,3,4,。思路：按照各种排序算法，找到排序结果的前K个数。思路1：最简单的方案，对数组进行排序，取最小的k个思路2：借鉴快速排序的思想，找partition的基准点povit，比较povit和k值的大小思路3:大数据处理的思想，
leetcode0954. 二倍数对数组-medium 智趣代码实验室 Leetcode 算法 c++leetcode 数据结构
1题目：二倍数对数组官方标定难度：中给定一个长度为偶数的整数数组arr，只有对arr进行重组后可以满足“对于每个0&arr){std::sort(arr.begin(),arr.end(),[](inta,intb){returnabs(a)>abs(b);});unordered_mapl;for(inti:arr){if(l[i*2]){l[i*2]--;}else{l[i]++;}}for(
代码随想录算法训练营第二十七天天天开心(∩_∩) 算法 leetcode 职场和发展
LeetCode.455分发饼干题目链接分发饼干题解classSolution{publicintfindContentChildren(int[]g,int[]s){intcount=0;Arrays.sort(g);Arrays.sort(s);for(inti=0;i=g[count]){count++;}}returncount;}}解题思路这段代码实现了"分发饼干"问题的解决方案，其核心
随机数组冒泡排序Java_Java开发新手冒泡排序 weixin_39605840 随机数组冒泡排序Java
原标题：Java开发新手冒泡排序/**冒泡排序(BubbleSort)。*在冒泡排序算法中，需要重复的走访要排序的数列，一次比较两个元素，*如果它们的大小顺序错误就把它们交换过来。本案例要求使用冒泡排序算法实现对数组的排序。有一个长度为10的整型数组，使用冒泡排序算法将数组按照升序排列，并输出排序的过程以及结果。**//**分析：*第一步：创建一个长度为10的数组*以后这里可以引申为用户输入一个数
java：数组的冒泡排序小鹿快跑～ Java java
eclipse使用Java实现数组的冒泡排序文章目录前言方案代码实现前言声明一个数组，包含10个元素，给每个元素赋值0~99的随机整数，使用冒泡算法对数组进行升序排序，并输出排序后的值方案生成随机数：arr[i]=(int)(Math.random()*100);//生成0~99的随机整数代码实现具体代码如下：packageday05;publicclassBubbleSort{publicsta
Java基础之冒泡排序、二分查找、封装灌木丛中的微风 java 算法开发语言
Java基础1.冒泡排序publicstaticvoidmain(String[]args){/*TODO定义数组的冒泡排序*/int[]intAr={3,2,1,5,6,4,2,1,8};bubbleSort(intAr);System.out.println(getArrStr(intAr));}publicstaticint[]bubbleSort(int[]intArr){/*冒泡排序：对
[毕业设计]一些基于yolov5项目高分毕业项目源码下载地址汇总海神之光. 毕设课程设计 YOLO
项目名称下载地址车辆检测计数+车牌定位+车牌识别的yolov4模板检测与yolov5车牌检测与LPRNet车牌检测源码+模型+详细说明.zip点我下载基于改进后的YOLOv5目标检测模型实现人群密度检测系统源码+模型+详细说明.zip点我下载基于YOLOv5实现微藻智能化在线检测系统源码+图片+说明文档.zip点我下载YOLOv5deepsort算法船舶等交通工具监测计数UI界面源码.zip点我下
SpringBoot 整合shiro实现权限管理拉提娜的爸爸
一、准备环境1、导入pom依赖org.apache.shiroshiro-spring1.4.1com.github.theborakompanionithymeleaf-extras-shiro2.0.0org.springframework.bootspring-boot-configuration-processortruecn.hutoolhutool-all4.6.62、配置文件#myb
Java数据结构和算法-希尔排序[移位式]算法实现 Shaw_Young
packagecom.young.sort;importjava.text.SimpleDateFormat;importjava.util.Arrays;importjava.util.Date;publicclassShellSort{publicstaticvoidmain(String[]args){//int[]arr={8,9,1,7,2,3,5,4,6,0};//shellSort2
go语言数据结构与排序算法 fbbqt golang 数据结构排序算法
packagemainimport"fmt"funcmain(){Bubble_Sort()Select_Sort()Insert_Sort()Shell_Sort()Heap_Sort()Merge_Sort()Quick_Sort()}一、1、冒泡排序//冒泡排序funcBubble_Sort(){str:=[]int{9,1,5,8,3,7,4,6,2}//正向冒泡fori:=0;istr[
STL容器
常用：1.vector动态数组，支持正常数组sort格式。遍历时注意借用迭代器vectoriterator::it;2.list与vector类似，可以相互替代，但是各有优缺点list采用链式思想，借用链表知识，便于插入删除，但花费空间大（因为有一个数组域和指针域）注：调用sort()形式为对象名.sort()，与一般数组方式不同3.string字符动态存储容器插入字符采用insert(位置，“字
基于Jetson Nano与PyTorch的无人机实时目标跟踪系统搭建指南
引言：边缘计算赋能智能监控在AIoT时代，将深度学习模型部署到嵌入式设备已成为行业刚需。本文将手把手指导读者在NVIDIAJetsonNano（4GB版本）开发板上，构建基于YOLOv5+SORT算法的实时目标跟踪系统，集成无人机控制与地面站监控界面，最终打造低功耗智能监控设备。通过本项目，读者将掌握：嵌入式端模型优化与部署技巧；多目标跟踪算法工程化实现；无人机-地面站协同控制架构；边缘计算场景下
【分治】快速排序-快速排序（medium）
快速排序（medium）题⽬描述：解法（数组分三块思想+随机选择基准元素的快速排序）：算法思路：算法流程：算法代码：题⽬链接：912.排序数组由于⼒扣的测试⽤例在不断加强，所以这⾥的数组划分三块的思想搭配随机选择基准元素的⽅法是⽐较优秀的。顺便说个有趣的事：官⽅题解的快排代码提交后会超时~~~2022/12/07题⽬描述：给你⼀个整数数组nums，请你将该数组升序排列。⽰例1：输⼊：nums=[5
盘点一个Python网络爬虫问题皮皮_f075
大家好，我是皮皮。一、前言前几天在Python最强王者群【刘桓鸣】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。image.png他自己的代码如下：importrequestskey=input("请输入关键字")res=requests.post(url="https://jf.10086.cn/cmcc-web-shop/search/query",data={"sortColu
数据编辑器所具备的数据整理功能 ykjhr_3d 编辑器
在企业的数据处理过程中，数据清洗与整理是至关重要的环节，而数据编辑器在这方面发挥着关键作用。在一份包含客户信息的数据表中，常常会出现缺失值的情况。比如客户的年龄、联系方式等字段可能因为各种原因没有被记录，这就形成了缺失值。数据编辑器提供了多种处理缺失值的方法。对于数值型变量，如客户的消费金额，如果存在缺失值，可以使用均值、中位数等方法进行填补。假设一家电商企业的数据表中，部分客户的某次消费金额缺失
最长连续序列 wyof
最长连续序列给定一个未排序的整数数组，找出最长连续序列的长度示例:输入:[100,4,200,1,3,2]输出:4解释:最长连续序列是[1,2,3,4]。它的长度为4方法一：先排序publicintlongestConsecutive(int[]nums){Arrays.sort(nums);intmaxSeq=0;for(inti=0;iset=newHashSetset=newHashSets
15、统计学基础：数据描述、推断与分析您的账号已被封禁统计学数据描述推断分析
统计学基础：数据描述、推断与分析1.统计类型概述在数据分析中，我们常常需要了解数据的各种特征，这就涉及到不同类型的统计方法。主要有参数统计和非参数统计，其中非参数统计中的顺序统计量在很多场景下有着独特的优势。1.1顺序统计量顺序统计量用于指定数据值在有序集合中的位置，它只要求数据值是有序的，因此适用于比参数统计更广泛的数据分布。常见的顺序统计量包括中位数、四分位数等。-中位数：是排序后分布中处于中
统计学①——概率论基础及业务实战数据小斑马统计学统计学基础概率分布随机变量期望和方差转盘
统计学系列目录（文末有超级大礼）：统计学②——概率分布（几何，二项，泊松，正态分布）统计学③——总体与样本统计学④——置信区间统计学⑤——假设验证一、统计学是什么？统计学分为两类，一类是描述性统计学，通过对数据的集中趋势和变异趋势的刻画来描述数据的分布情况，集中趋势有平均值，中位数和众数三个指标，变异趋势则有全距，四分位距，百分位距，方差，标准差等指标来衡量另一类是推断统计学，通过对样本的统计来推
C++ 快速排序算法：从原理到优化的实战指南暮见朝见暮算法数据结构排序算法快排
快速排序（QuickSort）作为C++中最常用的高效排序算法之一，凭借其平均O(nlogn)的时间复杂度和原地排序的特性，在实际开发和算法竞赛中被广泛应用。本文将从基本原理出发，逐步深入快速排序的实现细节、优化策略，并结合C++特性探讨其在实际场景中的最佳实践。一、快速排序的核心原理：分治思想的经典应用快速排序的核心思想是“分而治之”，通过以下三个步骤递归实现排序：选择基准值（Pivot）：从数
JavaScript-冒泡排序 Yisuo烟雨
冒泡排序冒泡排序（BubbleSort），是一种计算机科学领域的较简单的排序算法。它重复地走访过要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越大的元素会经由交换慢慢“浮”到数列的顶端，故名。//①定义一个数组vararr=[40,8,15,18,12];console.log(
python学习DAY4打卡星仔编程 python学习打卡学习
DAY4缺失值的处理题目：初识pandas库与缺失数据的补全pandas是Python里一个强大且广泛使用的开源数据分析与处理库按照示例代码的要求，去尝试补全信贷数据集中的数值型缺失值打开数据（csv文件、excel文件）查看数据（尺寸信息、查看列名等方法）查看空值众数、中位数填补空值利用循环补全所有列的空值完成后在py文件中独立完成一遍，并且利用debugger工具来查看属性（不借助函数显式查看
pandas库 DataFrame的常见操作
目录一.Pandas库的核心特点与应用场景1.表格数据处理2.与NumPy的区别3.数据转换二.Pandas与OpenPyXl的对比三.DataFrame与Series数据类型四.DataFrame常用操作排序：df.sort_values(by='列名',ascending=False)按指定列降序排序，整行数据同步调整，当参数值为ture时则为升序排序或默认升序排序数据替换：df['列名'].
bypass各种waf--php回调后门南岸青栀* Web安全
文章目录bypass各种waf--php回调后门一般过狗思路双参数回调后门uasortarray_reducearray_udiff单参数后门终极奥义这个是php全版本支持的，且不报不杀稳定执行：再来一个：参考链接：bypass各种waf–php回调后门一般过狗思路call_user_func('assert',$_REQUEST['pass'])双参数回调后门uasort
华为OD机试2025B卷 - 热点网站统计 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试华为OD机试 2025B卷华为OD2025B卷华为OD机考 2025B卷
热点网站统计华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述企业路由器的统计页面，有一个功能需要动态统计公司访问最多的网页URLtopN。请设计一个算法，可以高效动态统计TopN的页面。输入描述每一行都是一个URL或一个数字，如果是URL，代表一段时间内的网页访问；如果是一个数字N，代表本次需要输出的TopN个U
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

再看快速排序（QuickSort）

你可能感兴趣的:(快速排序,sort,中位数,topN)