内核新视界

记一次x86 kvm虚机缺失 tlb flush 引发的 CVE 漏洞

文章目录

- - 1 背景介绍
  - 2 vcpu 延迟远程 tlb flush 机制及原理
  - 3 tlb flush 缺失及 CVE 漏洞触发

1 背景介绍

linux 5.5 版本以下才会触发，之后的版本已经修复该问题。

触发现象：
在x86 intel 芯片上的 kvm 虚机环境中：当有多个进程或者多个线程在频繁或者多次执行 malloc，write，read，free 操作时，有概率触发任务程序崩溃产生 core dump 或者程序 abort。

该问题触发对应 CVE-2019-3016，并且社区给出了对应的修复 patch：Merge branch ‘cve-2019-3016’ into kvm-next-5.6。
首先描述一下该 CVE 漏洞原文：

上述崩溃触发原因是缺少 TLB flush，这可能使运行 KVM 客户机中的进程访问到它不应该访问的客户机中的内存位置。
（解释一下上面的现象：对于一个正常程序来说，如果触发该问题，那么可能读取到的数据并不是原来程序所期望的数据，如原来内存中保存的是一个可访问的指针，在问题触发后，数据不再是可访问的指针，而是一个非法地址，当程序按照原有意图访问指针内容时，则有可能触发 data abort，导致程序被操作系统 kill，并产生 core dump。如果程序内部有一些 assert，比如 glibc 库中检测相关元数据，如果不是原有数据则可能调用 abort() 退出程序。
这是一些正常情况，如果该程序故意利用该漏洞，那么极有可能构建出特定环境，访问到其他程序使用的内存数据，从而执行一些恶意操作，因此该问题被定义为 CVE 漏洞）
这个问题仅限于 host 内核 4.10 以后版本，客户机运行 4.16 以后内核，并且客户机启用半虚拟化支持。该问题主要影响 AMD 处理器，但不能排除 intel cpu 也有该问题（因为从触发原理上来看，intel 也会触发）。

再介绍一下修复补丁的内容：

当远程 vcpu （这里指从当前 vcpu 角度来看，处于其他物理 cpu 的 vcpu 被称为远程 vcpu）不运行时，KVM 管理程序可以为客户机提供延迟远程 tlb flush 能力（该能力用于提高vcpu 运行性能）。当使用此特性时，tlb flush 只会在远程 vcpu 计划再次运行（再次运行指调度到该 vcpu 运行）时发生，这操作可以避免不必要的和昂贵的 ipi 操作（提供性能的关键就是避免 ipi 操作，后续介绍原理）。
在某些情况下，当客户机发起远程延迟 tlb flush 操作时，管理机可能会错过该请求。也有可能客户机错误地认为它已经将远程 vcpu 标记为需要刷新，而实际上该请求已经被管理机意外清除。
在这两种情况下，这都将导致 vcpu 中出现无效的 tlb 转换，可能允许访问客户机地址空间中不应该访问的内存位置。

上面的描述可能很抽象，接下来先详细了解下什么是延迟远程 tlb flush 操作，以及何时会执行远程 tlb flush 操作。

2 vcpu 延迟远程 tlb flush 机制及原理

TLB 全称是 Translation Lookaside Buffer。在开启 mmu 处理器上，当处理器取指或者访问内存时都需要进行地址翻译，即把虚拟地址翻译成物理地址。而翻译过程对于 cpu 来说是一个漫长的过程，需要经历从 pgd 到几个 level 的 translation table，最终找到实际的物理页，从而产生性能开销。为了提升性能，mmu 新增了 tlb 单元，同 cache 类似，tlb 把翻译后缓存条目保存在高速缓存中，当访问地址时，首先从 tlb cache 中寻找翻译后的条目使用，从而避免了翻译过程。当程序修改了地址映射关系，访问属性等页表时，则对应的 tlb 条目需要刷新或者无效化，以便后续能正确访问更新后的映射关系。

tlb 一致性问题：
tlb 也是一种 cache，因此当在多处理器系统中，tlb 条目的副本可能缓存在不同处理器的缓存中，因此存在一致性问题，一般而言处理器不维护该一致性（尤其是 x86，arm64 可以通过 inner share 属性来保证 tlb 缓存在不同处理器之间的一致性）。
因此一旦修改了页表属性或者映射关系，需要操作系统将所有使用该页表的 cpu 对应的 tlb cache 进行 tlb flush 操作，使其缓存 tlb 无效化，并在再次访问修改后的地址时重新进行地址翻译工作。

介绍了上面两个概念，接下来看看操作系统是如何来执行 tlb flush 的。针对该问题，我们不讨论内核自身的 tlb flush，主要讨论用户程序对内核发起的相关请求。

当用户程序执行 malloc，free，brk，mmap。munmap，mprotoct等申请内存，释放内存，修改映射属性等操作时将会触发 tlb flush 路径。接下来以 munmap 系统调用为例：
当用户程序使用 free 释放内存时，对于 glibc 在一定条件下会执行 munmap 释放一大块内存（这里不展开），最终会通过 sys_munmap 系统调用接触相关内存映射，arm64/x86 有如下路径：

SYSCALL_DEFINE2(munmap, unsigned long, addr, size_t, len)
  -> do_munmap
    -> unmap_region
      -> unmap_vmas
      -> free_pgtables
      -> tlb_finish_mmu
        -> arch_tlb_finish_mmu(tlb, start, end, force);
          -> tlb_flush_mmu
            -> tlb_flush_mmu_tlbonly
              -> tlb_flush
                -> __flush_tlb_range (arm64)
                -> flush_tlb_mm_range (x86)

可以看到相关任务在解除某段地址映射最后会调用 tlb_flush 来刷新相关缓存 tlb 以此来保证一致性。
对于 arm64 有如下代码：

static inline void __flush_tlb_range(struct vm_area_struct *vma,
				     unsigned long start, unsigned long end,
				     unsigned long stride, bool last_level)
{
...
  	start = __TLBI_VADDR(start, asid);
	end = __TLBI_VADDR(end, asid);

	dsb(ishst);
	for (addr = start; addr < end; addr += stride) {
		if (last_level) {
			__tlbi(vale1is, addr);
			__tlbi_user(vale1is, addr);
		} else {
			__tlbi(vae1is, addr);
			__tlbi_user(vae1is, addr);
		}
	}
	dsb(ish);
}

#define __TLBI_0(op, arg) asm ("tlbi " #op "\n"				       \
		   ALTERNATIVE("nop\n			nop",		       \
			       "dsb ish\n		tlbi " #op,	       \
			       ARM64_WORKAROUND_REPEAT_TLBI,		       \
			       CONFIG_QCOM_FALKOR_ERRATUM_1009)		       \
			    : : )

#define __TLBI_1(op, arg) asm ("tlbi " #op ", %0\n"			       \
		   ALTERNATIVE("nop\n			nop",		       \
			       "dsb ish\n		tlbi " #op ", %0",     \
			       ARM64_WORKAROUND_REPEAT_TLBI,		       \
			       CONFIG_QCOM_FALKOR_ERRATUM_1009)		       \
			    : : "r" (arg))

#define __TLBI_N(op, arg, n, ...) __TLBI_##n(op, arg)

#define __tlbi(op, ...)		__TLBI_N(op, ##__VA_ARGS__, 1, 0)

arm64 最终使用 tlbi op 来无效化相关 tlb 缓存，其中/op 是vale1is，is 代表 inner shareable，这里意思就是无效化内部可共享相关的所有 tlb 缓存。换句话说就是，不仅是本地 cpu 对应的 tlb 缓存需要无效化，其他 cpu 对应的只要是 inner shareable 属性页表也会有 tlb 无效化操作，这是由硬件来保证的。如果op不带is则只会无效化本地 cpu 的 tlb 缓存。

再来看一下对于一个 x86 的代码，x86的flush_tlb_mm_range分为 host os 和 guest os 实现：

void flush_tlb_mm_range(struct mm_struct *mm, unsigned long start,
				unsigned long end, unsigned long vmflag)
{
...
	if (mm == this_cpu_read(cpu_tlbstate.loaded_mm)) {
		VM_WARN_ON(irqs_disabled());
		local_irq_disable();
		flush_tlb_func_local(&info, TLB_LOCAL_MM_SHOOTDOWN);
		local_irq_enable();
	}

	if (cpumask_any_but(mm_cpumask(mm), cpu) < nr_cpu_ids)
		flush_tlb_others(mm_cpumask(mm), &info);
...
}

static inline void flush_tlb_others(const struct cpumask *cpumask,
				    const struct flush_tlb_info *info)
{
	PVOP_VCALL2(mmu.flush_tlb_others, cpumask, info);
}
对于 host os 和 guest os flush_tlb_others 实现是不一样的：
host os 如下：
mmu.flush_tlb_others = native_flush_tlb_others

而对于 guest os，有前面 steal time 机制分析可以知道，guest os 启动时可以知道自己是虚机运行，
因此可以执行额外的针对虚机的赋值操作，这里就会针对虚拟化类型 xen，kvm，虚拟化平台 intel，amd 进行初始化，
当检测到是 intel/amd kvm 并且支持 KVM_FEATURE_PV_TLB_FLUSH 特性时，有：
mmu.flush_tlb_others = kvm_flush_tlb_others

首先看看 host os tlb flush 对应的 native_flush_tlb_others 操作：

void native_flush_tlb_others(const struct cpumask *cpumask,
			     const struct flush_tlb_info *info)
{
...
...
	if (info->freed_tables)
		smp_call_function_many(cpumask, flush_tlb_func_remote,
			       (void *)info, 1);
	else
		on_each_cpu_cond_mask(tlb_is_not_lazy, flush_tlb_func_remote,
				(void *)info, 1, GFP_ATOMIC, cpumask);
}

flush_tlb_func_remote
	-> flush_tlb_func_common
static void flush_tlb_func_common(const struct flush_tlb_info *f,
				  bool local, enum tlb_flush_reason reason)
{
...
...
	if (f->end != TLB_FLUSH_ALL &&
...
	} else {
		/* Full flush. */
		local_flush_tlb();
		if (local)
			count_vm_tlb_event(NR_TLB_LOCAL_FLUSH_ALL);
		trace_tlb_flush(reason, TLB_FLUSH_ALL);
	}
...
}

可以看到 host os 的 tlb flush 操作在 x86 上会通过 on_each_cpu_cond_mask 发送 ipi 到该任务所有运行过的 cpu 上执行 local_flush_tlb。因此 x86 的一次 tlb flush 操作代价是很昂贵的因为它每执行一次 tlb 都需要向所有运行过的 cpu 发送 ipi，然后在远端执行 tlb flush，以此保证一致性。
对比 arm64 可以看到 arm64 在这里的实现更为强大，通过一个 tlbi vale1is 就可以完成相关 tlb 的刷新，少了很多软件操作。

回过头来看，也就马上知道为什么 x86 针对 host 和 guest 有不同的 tlb flush 实现了，因为 x86 针对 tlb flush 这种昂贵的 ipi 操作针对虚拟机运行可以进行一个特殊优化，该优化机制就是延迟远程 tlb 刷新操作。

在之前关于 kvm 的 vcpu entry 分析时知道，vcpu 在进入 guest os 运行时会有一个加载 vcpu 上下文的操作，包括加载 guest 寄存器内容，注入中断，检查一些额外状态，steal time 更新等。
利用该机制，那么就可以针对 tlb flush 有一个额外优化。
当guest os 中发生 tlb flush 后，除了刷新本地 tlb，还需要刷新其他 cpu 的tlb，对于该任务使用过的其他 vcpu对应的物理cpu，如果正在运行 vcpu，那么没有选择，还是需要发送 ipi 使其同步执行 tlb flush 操作，然而对于该任务对应的其他 vcpu 如果没有处于运行状态，那么此时发送 ipi 时没有必要的，我们只需要在其对应使用的数据结构中标记需要执行 tlb flush 即可，等到该 vcpu 即将运行，在 vcpu 预备阶段我们可以读取该请求，并主动去执行 tlb flush 操作即可，这样可以避免一次远程 vcpu 的 ipi 操作，也可以在vcpu运行时刷新 tlb 保证一致性，一举两得，可以看到大佬为了优化提升性能真的用心良苦，当然该机制也就被称为了延迟远程 tlb 刷新。OK，现在看看虚拟化的 tlb flush怎么实现的：

static void kvm_flush_tlb_others(const struct cpumask *cpumask,
			const struct flush_tlb_info *info)
{
	u8 state;
	int cpu;
	struct kvm_steal_time *src;
	struct cpumask *flushmask = this_cpu_cpumask_var_ptr(__pv_tlb_mask);

	// cpumask 记录了该任务所运行过的所有 cpu
	cpumask_copy(flushmask, cpumask);
	/*
	 * We have to call flush only on online vCPUs. And
	 * queue flush_on_enter for pre-empted vCPUs
	 */
	for_each_cpu(cpu, flushmask) {
		src = &per_cpu(steal_time, cpu);
		state = READ_ONCE(src->preempted);
		if ((state & KVM_VCPU_PREEMPTED)) {
			if (try_cmpxchg(&src->preempted, &state,
					state | KVM_VCPU_FLUSH_TLB))
				__cpumask_clear_cpu(cpu, flushmask);
		}
	}

	native_flush_tlb_others(flushmask, info);
}

首先，本地 cpu 还是会在最后执行 tlb flush。但是针对远程 cpu，通过percpu(&steal_time)->preempted 判断对应 cpu 是否有KVM_VCPU_PREEMPTED标记，如果有则在 preempted 基础上添加KVM_VCPU_FLUSH_TLB标记。
steal_time 之前分享过是记录窃取时间的机制，其中的 preempted 是记录该cpu是否被抢占的标记，该标记在 vcpu exit 时被设置，在 vcpu entry 时被清除，因此上面通过 KVM_VCPU_PREEMPTED 标记是否存在可以知道 vcpu 是否在运行，所以如果有了该标记，那么 vcpu 没有运行，我们就附加上KVM_VCPU_FLUSH_TLB标记请求，该请求在 vcpu entry 时除了清除 KVM_VCPU_PREEMPTED 还会检测是否有 KVM_VCPU_FLUSH_TLB 标记，如果有则调用平台对应的 tlb_flush 回调执行 tlb 刷新操作，接着再去清除掉 KVM_VCPU_FLUSH_TLB 标记。

接下来看看相关代码实现：
qemu 通过 ioctl 开始启动 kvm（KVM_RUN）后的代码流程（只罗列我们关心的部分）：

kvm_vcpu_ioctl
  -> case KVM_RUN
    -> kvm_arch_vcpu_ioctl_run
      -> vcpu_load
        -> kvm_arch_vcpu_load
          -> kvm_make_request(KVM_REQ_STEAL_UPDATE, vcpu); (标记 vcpu KVM_REQ_STEAL_UPDATE)
      -> vcpu_run
        -> for (;;)
            -> vcpu_enter_guest
                // 在进入 guestOS 之前会有一些列的请求判断, 
                // 做完所有请求后才会进入 guestOS。
                -> if (kvm_check_request(KVM_REQ_STEAL_UPDATE, vcpu))
					record_steal_time(vcpu);
				// 进入 guestOS 执行 guestOS 代码，
				// 回调根据 intel 或者 amd 芯片不同调用不同运行代码。
				-> kvm_x86_ops->run(vcpu);
				// 根据退出原因调用处理函数。
				-> r = kvm_x86_ops->handle_exit(vcpu);
            -> 如果需要调度则执行调度
            -> 中断，信号等原因则会退出该循环
      -> vcpu_put
        -> kvm_arch_vcpu_put
          -> kvm_steal_time_set_preempted

开始执行 kvm 时，首先调用 vcpu_load 预处理一些 vcpu 事务，包括为 vcpu 添加 KVM_REQ_STEAL_UPDATE 标记。

接着在 vcpu_run 中是一个无限循环，意味着没有特殊的情况，vcpu 将会一直执行，此时调用 vcpu_enter_guest 进入 guestOS 执行 guest 代码。但在切换到 vmm non-root 模式之前，还需要根据 kvm_check_request 检测 vcpu 是否有请求处理，比如我们关心的KVM_REQ_STEAL_UPDATE ，KVM_REQ_STEAL_UPDATE 中的处理函数record_steal_time中一部分能力是将会根据是否存在 KVM_VCPU_FLUSH_TLB 标记来执行延迟的 tlb flush 操作。

然后才是调用 kvm_x86_ops->run(vcpu); 进入非根模式执行 guestOS 代码。如果遇到中断，异常，IO 等则会退出该回调，接着在 kvm_x86_ops->handle_exit(vcpu); 中对退出的原因进行相应处理，不是所有处理都可以在这里完成，比如有用户的 IO 信号，中断注入需要在 kvm 和 qemu 中才能处理。
最后当 vcpu 无法继续执行，必须交由 kvm 或者 qemu 来进行进一步异常处理。vcpu_put 中调用 kvm_steal_time_set_preempted 处理 steal_time 相关的逻辑。

这里贴一下 steal time 和 vcpu 使用的数据结构：

struct kvm_vcpu_arch {
	struct {
		u64 msr_val;
		u64 last_steal;
		struct gfn_to_hva_cache stime;
		struct kvm_steal_time steal;
	} st;
}

struct kvm_steal_time {
	__u64 steal;
	__u32 version;
	__u32 flags;
	__u8  preempted;
	__u8  u8_pad[3];
	__u32 pad[11];
};

steal time 机制不详述，可以看之前的 steal time 机制分析。

当进入 vcpu 之前记录 steal_time:

// guest os 共享 struct kvm_steal_time 结构体给 host os，通过 MSR_KVM_STEAL_TIME 将
// percpu 的 steal_time 首地址传递给了 host os并保存在 struct kvm_vcpu_arch 中。
static DEFINE_PER_CPU_DECRYPTED(struct kvm_steal_time, steal_time) __aligned(64);

static void kvm_register_steal_time(void)
{
	int cpu = smp_processor_id();
	struct kvm_steal_time *st = &per_cpu(steal_time, cpu);

	if (!has_steal_clock)
		return;

	wrmsrl(MSR_KVM_STEAL_TIME, (slow_virt_to_phys(st) | KVM_MSR_ENABLED));
	pr_info("kvm-stealtime: cpu %d, msr %llx\n",
		cpu, (unsigned long long) slow_virt_to_phys(st));
}


/// vcpu load
static void record_steal_time(struct kvm_vcpu *vcpu)
{
	if (!(vcpu->arch.st.msr_val & KVM_MSR_ENABLED))
		return;

    // 首先从 kvm 的 guestOS(根据 slot hva 偏移) 中读取出 struct kvm_steal_time，
    // 并存放到 vcpu->arch.st.steal 中。
	if (unlikely(kvm_read_guest_cached(vcpu->kvm, &vcpu->arch.st.stime,
		&vcpu->arch.st.steal, sizeof(struct kvm_steal_time))))
		return;

	/*
	 * Doing a TLB flush here, on the guest's behalf, can avoid
	 * expensive IPIs.
	 */
	// 取出 arch.st.steal.preempted 值并清零，如果取出值包含 KVM_VCPU_FLUSH_TLB，
	// 则去做 tlb flush。这里通过注释也可以看到，延迟 tlb 刷新操作，可以避免代价昂贵的
	// ipi 操作。
	if (xchg(&vcpu->arch.st.steal.preempted, 0) & KVM_VCPU_FLUSH_TLB)
		kvm_vcpu_flush_tlb(vcpu, false);

    // 后面则是将 struct kvm_steal_time steal; 相关信息更新并回写到 kvm guestOS 中。
	if (vcpu->arch.st.steal.version & 1)
		vcpu->arch.st.steal.version += 1;  /* first time write, random junk */

	vcpu->arch.st.steal.version += 1;

	kvm_write_guest_cached(vcpu->kvm, &vcpu->arch.st.stime,
		&vcpu->arch.st.steal, sizeof(struct kvm_steal_time));

	smp_wmb();

	vcpu->arch.st.steal.steal += current->sched_info.run_delay -
		vcpu->arch.st.last_steal;
	vcpu->arch.st.last_steal = current->sched_info.run_delay;

	kvm_write_guest_cached(vcpu->kvm, &vcpu->arch.st.stime,
		&vcpu->arch.st.steal, sizeof(struct kvm_steal_time));

	smp_wmb();

	vcpu->arch.st.steal.version += 1;

	kvm_write_guest_cached(vcpu->kvm, &vcpu->arch.st.stime,
		&vcpu->arch.st.steal, sizeof(struct kvm_steal_time));
}

kvm_write_guest_cached, kvm_read_guest_cached 是通过 steal time 中介绍的机制实现的，通过 KVM_MSR_ENABLED 判断是否支持 msr 特性，支持了那么就可以通过msr 写过来的地址保存在 struct kvm_vcpu_arch，然后通过kvm维护的 GPA 到 HVA 的转换关系可以从 host 读写 guest 的内存地址空间。因此 guest os 在 struct kvm_steal_time 中设置的 KVM_VCPU_FLUSH_TLB 标记，host 在此时可以通过 kvm_read_guest_cached 读取到，并处理。

接着当 vcpu 退出时，会执行下面的代码：

static void kvm_steal_time_set_preempted(struct kvm_vcpu *vcpu)
{
	if (!(vcpu->arch.st.msr_val & KVM_MSR_ENABLED))
		return;

    // 退出 vcpu， vcpu 将完全停止运行被调度出去，那么标记 vcpu 被抢占。
	vcpu->arch.st.steal.preempted = KVM_VCPU_PREEMPTED;

    // 将 arch.st.steal.preempted 信息更新到 guestOS 中。
	kvm_write_guest_offset_cached(vcpu->kvm, &vcpu->arch.st.stime,
			&vcpu->arch.st.steal.preempted,
			offsetof(struct kvm_steal_time, preempted),
			sizeof(vcpu->arch.st.steal.preempted));
}

总结一下：vcpu 退出时标记 vcpu 被抢占，然后同步该信息到 vcpu 内存空间，接着 guest os 内的其他 vcpu 根据被抢占标记 tlb flush，然后当对应 vcpu 即将运行时， host 在进入 vcpu load 阶段，读取 guest os 内存中的数据，并处理 tlb flush 标记，执行 tlb flush，清除标记，同步状态，最后再次进入 vcpu 运行。
OK，到这里看一切都很完美，原理和机制也都理清楚了。接下来看看为什么会触发 CVE 漏洞。

3 tlb flush 缺失及 CVE 漏洞触发

首先漏洞触发有两个问题，先看第一个问题对应的 patch：

kvm_steal_time_set_preempted() may accidentally clear KVM_VCPU_FLUSH_TLB
bit if it is called more than once while VCPU is preempted.

diff --git a/arch/x86/kvm/x86.c b/arch/x86/kvm/x86.c
index cf917139de6ba..8c9369151e9f3 100644
--- a/arch/x86/kvm/x86.c
+++ b/arch/x86/kvm/x86.c
@@ -3504,6 +3504,9 @@ static void kvm_steal_time_set_preempted(struct kvm_vcpu *vcpu)
 	if (!(vcpu->arch.st.msr_val & KVM_MSR_ENABLED))
 		return;
 
+	if (vcpu->arch.st.steal.preempted)
+		return;
+
 	vcpu->arch.st.steal.preempted = KVM_VCPU_PREEMPTED;
 
 	kvm_write_guest_offset_cached(vcpu->kvm, &vcpu->arch.st.stime,

逻辑很简单，在 vcpu exit 中的 kvm_steal_time_set_preempted 中，不再直接赋值被抢占标记，而是判断 preempted 是否有值，有值则跳过。

每当访问 vcpu 的数据时，都有 vcpu_load 和 vcpu_put 操作，以获取正确引用和同步 vcpu 数据访问。然而 kvm_steal_time_set_preempted 是在 vcpu_put 中调用的。kvm_steal_time_set_preempted中则会有vcpu->arch.st.steal.preempted = KVM_VCPU_PREEMPTED;。也就是说每执行一次 vcpu_load/vcpu_put 都会触发设置 preempted 操作。但是执行 vcpu_load/vcpu_put 不是 vcpu run ioctl 独有的，当我们访问 vcpu 数据时都有这个操作，那么这就存在一个问题，如果在我们 vcpu load ---- vcpu put 期间，对应 vcpu 正在运行，并且执行了 tlb flush，那么对应的 preempted 就会附加上 KVM_VCPU_FLUSH_TLB，然而此时由于外部执行 vcpu put 也刚好执行，那么对应的 KVM_VCPU_FLUSH_TLB 标记则很有可能在本次 vcpu put 操作中被覆盖掉，从而对应的远程 vcpu 错失一次 tlb flush 操作。因此该 patch 通过检测 preempted 是否有值来判断是否已经被赋值，以避免覆盖掉 vcpu load 和 vcpu put 期间的 KVM_VCPU_FLUSH_TLB 请求。因为进入 vcpu 是会清 0 preempted 字段的，那么只要 preempted 有值，则一定是被抢占或者附加了 KVM_VCPU_FLUSH_TLB 标记，所以 kvm_steal_time_set_preempted 中可以通过判断 preempted 是否有值来直接返回。

接下来看第二部分 patch，第二部分涉及多个patch，这里只贴最重要那一个：

There is a potential race in record_steal_time() between setting
host-local vcpu->arch.st.steal.preempted to zero (i.e. clearing
KVM_VCPU_PREEMPTED) and propagating this value to the guest with
kvm_write_guest_cached(). Between those two events the guest may
still see KVM_VCPU_PREEMPTED in its copy of kvm_steal_time, set
KVM_VCPU_FLUSH_TLB and assume that hypervisor will do the right
thing. Which it won't.

Instad of copying, we should map kvm_steal_time and that will
guarantee atomicity of accesses to @preempted.

diff --git a/arch/x86/kvm/x86.c b/arch/x86/kvm/x86.c
index 0795bc876abcc..f1845df7e7c32 100644
--- a/arch/x86/kvm/x86.c
+++ b/arch/x86/kvm/x86.c
@@ -2581,45 +2581,47 @@ static void kvm_vcpu_flush_tlb(struct kvm_vcpu *vcpu, bool invalidate_gpa)
 
 static void record_steal_time(struct kvm_vcpu *vcpu)
 {
+	struct kvm_host_map map;
+	struct kvm_steal_time *st;
+
 	if (!(vcpu->arch.st.msr_val & KVM_MSR_ENABLED))
 		return;
 
-	if (unlikely(kvm_read_guest_cached(vcpu->kvm, &vcpu->arch.st.stime,
-		&vcpu->arch.st.steal, sizeof(struct kvm_steal_time))))
+	/* -EAGAIN is returned in atomic context so we can just return. */
+	if (kvm_map_gfn(vcpu, vcpu->arch.st.msr_val >> PAGE_SHIFT,
+			&map, &vcpu->arch.st.cache, false))
 		return;
 
+	st = map.hva +
+		offset_in_page(vcpu->arch.st.msr_val & KVM_STEAL_VALID_BITS);
+
 	/*
 	 * Doing a TLB flush here, on the guest's behalf, can avoid
 	 * expensive IPIs.
 	 */
 	trace_kvm_pv_tlb_flush(vcpu->vcpu_id,
-		vcpu->arch.st.steal.preempted & KVM_VCPU_FLUSH_TLB);
-	if (xchg(&vcpu->arch.st.steal.preempted, 0) & KVM_VCPU_FLUSH_TLB)
+		st->preempted & KVM_VCPU_FLUSH_TLB);
+	if (xchg(&st->preempted, 0) & KVM_VCPU_FLUSH_TLB)
 		kvm_vcpu_flush_tlb(vcpu, false);
 
-	if (vcpu->arch.st.steal.version & 1)
-		vcpu->arch.st.steal.version += 1;  /* first time write, random junk */
+	vcpu->arch.st.steal.preempted = 0;
 
-	vcpu->arch.st.steal.version += 1;
+	if (st->version & 1)
+		st->version += 1;  /* first time write, random junk */
 
-	kvm_write_guest_cached(vcpu->kvm, &vcpu->arch.st.stime,
-		&vcpu->arch.st.steal, sizeof(struct kvm_steal_time));
+	st->version += 1;
 
 	smp_wmb();
 
-	vcpu->arch.st.steal.steal += current->sched_info.run_delay -
+	st->steal += current->sched_info.run_delay -
 		vcpu->arch.st.last_steal;
 	vcpu->arch.st.last_steal = current->sched_info.run_delay;
 
-	kvm_write_guest_cached(vcpu->kvm, &vcpu->arch.st.stime,
-		&vcpu->arch.st.steal, sizeof(struct kvm_steal_time));
-
 	smp_wmb();
 
-	vcpu->arch.st.steal.version += 1;
+	st->version += 1;
 
-	kvm_write_guest_cached(vcpu->kvm, &vcpu->arch.st.stime,
-		&vcpu->arch.st.steal, sizeof(struct kvm_steal_time));
+	kvm_unmap_gfn(vcpu, &map, &vcpu->arch.st.cache, true, false);
 }
 
 int kvm_set_msr_common(struct kvm_vcpu *vcpu, struct msr_data *msr_info)
@@ -3501,18 +3503,25 @@ void kvm_arch_vcpu_load(struct kvm_vcpu *vcpu, int cpu)
 
 static void kvm_steal_time_set_preempted(struct kvm_vcpu *vcpu)
 {
+	struct kvm_host_map map;
+	struct kvm_steal_time *st;
+
 	if (!(vcpu->arch.st.msr_val & KVM_MSR_ENABLED))
 		return;
 
 	if (vcpu->arch.st.steal.preempted)
 		return;
 
-	vcpu->arch.st.steal.preempted = KVM_VCPU_PREEMPTED;
+	if (kvm_map_gfn(vcpu, vcpu->arch.st.msr_val >> PAGE_SHIFT, &map,
+			&vcpu->arch.st.cache, true))
+		return;
+
+	st = map.hva +
+		offset_in_page(vcpu->arch.st.msr_val & KVM_STEAL_VALID_BITS);
+
+	st->preempted = vcpu->arch.st.steal.preempted = KVM_VCPU_PREEMPTED;
 
-	kvm_write_guest_offset_cached(vcpu->kvm, &vcpu->arch.st.stime,
-			&vcpu->arch.st.steal.preempted,
-			offsetof(struct kvm_steal_time, preempted),
-			sizeof(vcpu->arch.st.steal.preempted));
+	kvm_unmap_gfn(vcpu, &map, &vcpu->arch.st.cache, true, true);
 }
 
 void kvm_arch_vcpu_put(struct kvm_vcpu *vcpu)

可以看到该 patch 将进入 vcpu 之前的 record_steal_time 函数以及 kvm_steal_time_set_preempted 中的所有kvm_write_guest_cached和 kvm_read_guest_cached修改成了 kvm_map_gfn 操作。

什么意思呢？之前 kvm_write_guest_cached/kvm_read_guest_cached是通过去取 guest os 得到副本数据，然后修改副本数据，再同步回 guest os 的方式更新共享的数据。现在改为了将guest os内存 map 到 host 来访问，这样可以保证原子访问数据，guest os 拿到的永远都是最新的数据。

既然这样修改，那么原来的逻辑又有怎样的问题呢？
设想一个场景：当host 从guest读取了struct kvm_steal_time 的副本到host，并开始处理，
而正在host读取了副本数据以后，vcpu在其他 cpu 上发生了 tlb flush，并在本 cpu 的原始 struct kvm_steal_time 结构上附加了 KVM_VCPU_FLUSH_TLB 标记，vcpu 认为你会正确的处理该 KVM_VCPU_FLUSH_TLB 请求。而实际情况是，host 此时访问的是该struct kvm_steal_time 的副本，并且按照自己的逻辑给 preempted 清零，完成处理后，将struct kvm_steal_time回写回 guest，此时问题发生了，再此期间 vcpu 标记的KVM_VCPU_FLUSH_TLB 被 host 的回写操作覆盖，意外的清除了 KVM_VCPU_FLUSH_TLB。那么此时 vcpu 也会错过一次 tlb flush 操作。通过 map 操作，数据之间为原子访问，我们可以处理掉上面描述的竞争状态，从而不会意外清除 tlb flush 请求。

通过上述两个 patch，我们可以清晰的看到 tlb flush 是如何丢失的，而 patch 又是如何解决问题，不得不说内核开发人员的心细。

那么接下来还剩下最后一个问题，丢失 tlb flush，对于应用程序到底意味着什么，为什么就变成了一个 CVE 漏洞呢？
同样的，试想下面一个场景：

task 1 通过 malloc 申请了一块 A 地址内存数据，并正常的读写了 A 地址
task 1 在完成处理后，释放了 A 地址。
由于一些临界条件，free 操作触发了 munmap 操作，A 地址被返回给了操作系统
操作系统调用 tlb flush 刷新 A 地址的 tlb 缓存并且释放了对应的 C 物理地址回系统中，如果由于上面逻辑触发，本次 tlb flush 丢失，没有刷新到 A 地址的 tlb 缓存，访问A地址还是能访问到 C 物理地址。
紧接着 task 1 又进行了 malloc 申请内存，本次申请到的地址还是 A 地址。
随后 task 2 通过 malloc 同样申请了一块内存，并且申请到 B 地址，并且该 B 地址是 glibc 通过 mmap 进行映射分配给 task 2 的。
task 2 随后访问 B 地址，通过 page fault 机制，内核给 task 2 B 地址分配实际物理地址，而此时正好分配到的时 task 1 A地址使用过的 C 物理地址。
我们知道 mmap 不会实际建立地址映射关系，而是通过 page fault 来实际分配物理内存。所以此时 task 1 去访问 A 地址，本意上如果没有缺失 tlb flush 操作，会触发 page fault 来申请新的物理地址。
但是此时由于 A 地址对应的 tlb 缓存并没有失效，因此不会触发 page fault，而是访问了原来的 tlb 缓存，即 task 1 通过 A 地址又可以继续访问 C 物理地址。
而实际上 C 物理地址是被分配给了 task2 使用，那么此时 task1 就可以随意访问 task2 中 B 地址中的任意数据。从而访问了不属于自己地址空间的内存位置，这即是一个 CVE 漏洞。

你可能感兴趣的:(linux,linux,kvm,tlb,flush)

Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
包含日志获取webshell 陈望_ning
日志文件关闭：Apache目录下的httpd.conf文件#ErrorLog"logs/error.log"#CustomLog"logs/access.log"common加#号为注释不产生日志文件如果去掉#将会在Apache/logs/目录下产生日志文件linux:access_logerror_logwindows:access.logerror.logaccess_log每一行记录了一次网
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
搭建云手机教程云博客-资源宝智能手机
搭建云手机教程本教程由分享：ziyouhua资源宝整理分享：www.httple.net首先检查自己vps是否支持这个项目sudoaptinstallcpu-checkerkvm-ok如果显示INFO:/dev/kvmexistsKVMaccelerationcanbeused表示支持，可以继续往下看ac13首先安装dockercurl-fsSLhttps://get.docker.com|sud
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
在Windows11上安装Linux操作系统的几种技术方案 yuanpan linux 运维服务器
在Windows11上安装Linux主要有以下几种技术方案，每种方案适用于不同的需求场景：1.WindowsSubsystemforLinux(WSL)适用场景：开发、命令行工具、轻量级Linux环境支持发行版：Ubuntu、Debian、KaliLinux、Fedora等优点：轻量级：无需虚拟机，直接在Windows上运行Linux命令行环境。无缝集成：可访问Windows文件系统，支持VSCo
Claude Code 超详细完整指南（2025最新版）笙囧同学 python
终端AI编程助手|高频使用点+生态工具+完整命令参考+最新MCP配置目录快速开始（5分钟上手）详细安装指南系统要求Windows安装（WSL方案）macOS安装Linux安装安装验证配置与认证首次认证环境变量配置代理配置⚡基础命令详解启动命令会话管理文件操作Think模式完全指南MCP服务器配置详解MCP基础概念添加MCP服务器10个必备MCP服务器MCP故障排除记忆系统详解高级使用技巧成本控制策
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
Linux中Samba服务器安装与配置文件長樂.- linux 运维服务器
Samba简述27zkqsamba是一个基于TCP/IP协议的开源软件套件，可以在Linux、Windows、macOS等操作系统上运行。它允许不同操作系统的计算机之间实现文件和打印机共享。samba提供了一个服务，使得Windows操作系统可以像访问本地文件一样访问Linux、Mac等操作系统上的共享文件。实现跨平台的文件共享，提高办公环境的效率和便利性。samba也支持Windows网络邻居协
ubuntu qt环境下出现No suitable kits found解决方案
1.清理QtCreator缓存QtCreator会缓存项目配置、索引等数据，可能导致某些异常。清理方法：(1)删除QtCreator配置目录bashrm-rf~/.config/QtProject/（Ubuntu/Linux）或Windows：cmdrmdir/s/q"%APPDATA%\QtProject"(2)清除QtCreator的编译缓存bashrm-rf~/.cache/QtProjec
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和使用 NoMachine 山岚的运维笔记 Linux 运维及使用 linux ubuntu 运维 nomachine 远程连接
NoMachine是一款适用于Linux（Ubuntu）及其他支持的操作系统的远程桌面应用程序，允许用户通过本地或远程系统从世界任何地方控制计算机。它可以在低带宽连接下工作，被专业人士和家庭用户广泛使用。NoMachine的主要功能高性能远程访问跨平台兼容性易于使用，因为用户界面友好提供强大的加密协议，如SSH、SSL及其他安全标准支持远程文件传输和打印服务允许从远程计算机进行音频和视频流媒体传输
linux实战--日志管理
简介日志文件重要的信息系统文件，及了许多重要的系统事件，包括用户的登录信息，系统的启动信息，系统的安全信息，邮寄相关信息，各种服务相关的信息。日志对安全也很重要。每天记录系统发生的各种事情，通过日志检查错误发生的原因或受到攻击时攻击者留下的痕迹。总的来说，日志是记录重大事件的文件。处理日志的工具rsyslog系统日志管理专职管理日志的工具，它产生各种信息文件，主要存放在/var/loglogrot
Windows系统第一次运行C语言程序，环境配置，软件安装等遇到的坑及解决方法灬爱码士灬 windows c语言开发语言
明确需要编辑器和编译器，并选择自己要用什么（我选的编辑器是VSCode：VisualStudioCode；编译器是gcc）下载VSCode并配置环境变量（这里没啥问题），安装C/C++的拓展安装Cygwin，用来在Windows操作系统上模拟Unix/Linux环境（Cygwin官网：https://www.cygwin.com/。）安装过程中镜像可以选择https://mirrors.aliyu
一篇教你学会Git 编程界的彭于晏qaq java GIT git
从安装到高级使用（2025最新版）引言：为什么Git是开发者必备技能Git（GlobalInformationTracker）作为最流行的分布式版本控制系统，由Linux之父LinusTorvalds于2005年创建，现已成为软件开发的基础设施。与传统集中式版本控制系统（如SVN）相比，Git具有三大核心优势：分布式架构：每个开发者本地都有完整仓库副本，支持离线工作高效分支管理：创建和切换分支几乎
基本服务 FTP & SMB 会飞的灰大狼 Centos7 linux
基本服务FTP&SMB前言：FTP简称为文件传输协议前面说的他可以做到备份的功能那么它可以做到文件传输的过程smb我们简单来说共享文件夹‍NFSNFS（NetworkFileSystem，网络文件系统）是一种分布式文件系统协议，允许不同计算机之间通过网络共享文件和目录，使远程文件系统像本地文件系统一样被访问。它最初由SunMicrosystems开发，现在已成为UNIX/Linux系统中常用的网络
Ubuntu lamp 会飞的灰大狼 linux ubuntu
Ubuntulamp前言在Ubuntu安装lamp架构我们了解到lamp是完整的架构我们前面了解到了集合了Linux系统apacheMySQL和PHP语言的完整架构我们前面说了Centos7中编译安装lamp那么我们去说一下在Ubuntu中安装‍‍安装apache2‍apt直接安装apache2apt-yinstallapache2‍启动apache2systemctlstartapache2#测
Linux文件权限与进程管理解析雨季西柚 linux
控制对文件的访问1。什么是文件系统权限？它是如何工作的？如何查看文件的权限？答：文件系统权限就是规定谁能对文件/文件夹做什么（比如看、改、删）的规则。简单说，就是分"所有者、所属组、其他人"三类，给每类分配"读、写、执行"三种权限。操作时系统先看你属于哪类，再查有没有对应权限，有就允许，没有就拦着。查看方式：Linux/mac：终端输ls-l文件名，看开头的rwxr--r--这类字符（3个一组，对
【Linux内核模块】调试技巧 byte轻骑兵 #嵌入式Linux驱动开发实战 linux
内核模块开发最让人头疼的不是写代码，而是调试——代码编译通过了，加载后却要么没反应，要么直接让系统崩溃。这就像在黑屋子里修机器，看不见摸不着。其实内核调试有一套成熟的工具箱，掌握这些工具和技巧，就能给内核装个监控监控仪，让问题无所遁形。目录一、调试前的安全须知：别让系统崩溃二、最基础也最常用：printk打印日志2.1printk的基本用法2.2控制日志输出2.3printk的高级技巧三、内核Oo
linux网卡显示未知未托管,linux有线网络显示设备未托管
NetworkManagerNetworkManager是为了使网络配置尽可能简单而开发的网络管理软件包，如果使用DHCP，NetworkManager会替换默认的路由表、从DHCP服务器获取IP地址并根据情况设置域名服务器，NetworkManager的目标是使网络能够开箱即用。NetworkManager由两部分组成:一个以超级用户运行的守护进程(network-manager)；一个前端管理
DNF 与 YUM 的区别详解：从 CentOS 7 到 CentOS 9 的演进
DNF与YUM的区别详解：从CentOS7到CentOS9的演进标签：CentOS、YUM、DNF、Linux包管理、系统升级、兼容性适用版本：CentOS7、CentOS8、CentOS9一、背景介绍CentOS中使用的包管理工具是RedHat系列系统的重要组成部分。随着系统版本升级，包管理器从yum（CentOS7）逐渐过渡到dnf（CentOS8及之后版本）。二、YUM与DNF对比表对比项Y
Python简单练习3 第九条雀 python 面试开发语言
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：1.进程：进程是程序的一次动态执行过程，是系统进行资源分配和调度的基本单位拥有独立的内存空间（代码段、数据段、堆栈等），进程间内存不共享包含进程PID、PPID、状态（运行、就绪、阻塞等）、优先级等属性进程间通信需通过管道、信号、共享内存等机制实现线程：线程是进程内的一个执行单元，是CPU调度的最小单位，共享所
docker-基础入门
docker入门dockers安装1.首先如果系统中已经存在旧的Docker，则先卸载：yumremovedocker\docker-client\docker-client-latest\docker-common\docker-latest\docker-latest-logrotate\docker-logrotate\docker-engine\docker-selinux2.配置Dock
Linux系统之lvremove 命令详解门前灯运维 linux 运维服务器 lvremove
lvremove命令详解一、命令概述lvremove是LVM（逻辑卷管理）工具集中用于删除逻辑卷（LV）的核心命令，可移除一个或多个逻辑卷，将其占用的逻辑扩展（LE）归还给卷组（VG），供其他逻辑卷复用。其核心功能是彻底删除逻辑卷及其关联数据，操作前需确保LV未被使用（如未挂载文件系统），且删除源LV会同时移除其所有依赖的快照卷。适用于清理废弃存储资源、释放卷组空间的场景。二、语法格式lvremo
linux查看lvm命令,LVM管理常用命令参数详细解释南大鳥 linux查看lvm命令
物理卷管理pvchangepvchange命令允许管理员改变物理卷的分配许可。如果物理卷出现故障，可以使用pvchange命令禁止分配物理卷上的PE。语法pvchange(选项)(参数)选项-u：生成新的UUID；-x：是否允许分配PE。参数物理卷：指定要修改属性的物理卷所对应的设备文件。实例使用pvchange命令禁止分配指定物理卷上的PE。在命令行中输入下面的命令：pvchange-xn/de
Linux从入门到精通——基础篇 weixin_30390075
一.关于Linux的简介1.什么是Linux？Linux这个词指的是Linux内核，它是用来驱动电脑里的硬件的，而Linux操作系统指的是Linux内核和GUN组织(GUN的全称为GUNisnotUnix)所编写的软件，有了这个内核和相应的软件，由“死”的机械硬件组成的计算机才变成了“活”的，需要注意的是，单纯的软件并不能代表Linux系统。2.Linux的特点和优势1．模块化程度高Linux的内
Linux DNS解析2 -- 网关DNS代理的作用
当网关设备仅配置了/etc/hosts文件，而没有运行任何DNS代理服务（如Dnsmasq、Pi-hole或Unbound）时，终端设备将无法通过网关实现完整的DNS域名解析。具体分析如下：一、核心问题：网关没有DNS服务监听53端口DNS协议使用UDP/TCP53端口进行通信。终端设备将网关IP（如192.168.1.1）设为DNS服务器时，会向该IP的53端口发送DNS请求。如果网关未运行任何
【WLAN】【调试】如何使用Wireshark分析加密的WiFi数据包花神庙码农 wireshark 802.11 WIFI 报文解密
作者简介：花神庙码农（专注于Linux、WLAN、TCP/IP、Python等技术方向）博客主页：花神庙码农，地址：https://blog.csdn.net/qxhgd系列专栏：WLAN技术如觉得博主文章写的不错或对你有所帮助的话，还望大家三连支持一下呀！！！关注✨、点赞、收藏、评论。如需转载请参考转载须知！！如何使用Wireshark分析加密的WiFi数据包引言加密方式上的限制解密报文操作编辑
ubuntu之坑（十四）——安装FFmpeg进行本地视频推流（在海思平台上运行）光电的一只菜鸡 linux虚拟机 ubuntu ffmpeg 音视频
1.编译x264（没有x264依赖项参考，有则跳过）参考blog：ubuntu22.04下编译ffmpeg-6.0,并且激活x264编码功能。记录一下踩坑（ERROR:x264notfoundusingpkg-config）需要注意：sudo./configure--enable-static--prefix=/usr/local/x264 在执行上面命令时可能遇到下面问题，这是在Linux
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s