主页

quick benchmark 工具

网址 https://quick-bench.com/ run local: https://github.com/FredTingaud/bench-runner 功能 可选compiler ,可选c++ 标准,可选编译选项 可以方便比较 cpu time/ noop time 示例 https://quick-bench.com/q/6tDxsmk3FMX55B8W1RrdiG_s7_k

阅读更多

opencl benchmark 工具

找到一款opencl-benchmark 工具 https://github.com/ProjectPhysX/OpenCL-Benchmark 双卡1080ti实测: yxc@hua-System-Product-Name:~/code/3/OpenCL-Benchmark$ ./make.sh .-----------------------------------------------------------------------------. |----------------.------------------------------------------------------------| | Device ID 0 | NVIDIA GeForce...

阅读更多

hbase 查询status

hbase shell hbase(main):004:0> status 1 active master, 0 backup masters, 8 servers, 0 dead, 179.2500 average load hbase(main):001:0> status 'simple' active master: 172.17.128.217:16000 1713846984224 0 backup masters 8 live servers 172.17.129.68:16020 1714282894493 requestsPerSecond=187.0, numberOfOnlineRegions=176, usedHeap...

阅读更多

docker build 过程中BuildKit 报错

问题 docker build 过程中 build kit报错 yxc@yxc-MS-7B89:~/code/3/vllm$ docker build -t yxc.vllm.cuda.1 . Sending build context to Docker daemon 28.02MB Step 1/54 : FROM nvidia/cuda:12.1.0-devel-ubuntu22.04 AS dev ---> 963712b8747f Step 2/54 : RUN apt-get update -y && apt-get install -y python3-pip git ---> Using cache ---> 50ac8...

阅读更多

cmake find_package() 处理方法

在 cmakelist.txt 文件中,find_package() 命令用于查找并加载外部库的设置。它并不直接管理依赖包,而是依赖于外部预设的模块或配置来找到这些库。 他找的路径是 cmake/module/XX.cmake 因此,如果是单独的项目,要进行编译,可以设置path set(CMAKE_MODULE_PATH "${CMAKE_CURRENT_SOURCE_DIR}/cmake:${CMAKE_MODULE_PATH}") 这样的话,会去项目的cmake 目录找

阅读更多

nethogs 查看进程网络带宽

sudo nethogs是一个在Linux系统中使用的命令行工具,用于监控网络流量。通过这个命令,用户可以实时查看哪些进程正在使用网络带宽。这对于诊断网络问题、监控网络使用情况或者仅仅是为了了解哪些应用程序正在访问网络非常有用。 安装 Nethogs 在大多数Linux发行版中,nethogs不会预装。你可以通过包管理器来安装它。 对于基于Debian的系统(如Ubuntu),可以使用: sudo apt-get install nethogs 使用 Nethogs 以下命令启动nethogs: sudo nethogs sudo是必需的,因为nethogs需要足够的权限来监控网络接口和查看所有进程的网络活动。 功能和输出解释 启动n...

阅读更多

kallsyms 调试工具,找到内核调用函数及模块

问题 Linux 内核:能否在编译或者运行环境中找出 a 模块调用的某个函数来源于另外哪个模块吗? 解决方案:kallsyms kallsyms 是 Linux 内核中一个重要的调试工具,它允许用户在内核运行时查看和解析内核符号。 kallsyms 的主要功能是提供内核符号的地址和名称,这些符号包括函数、变量、结构体、枚举等。用户可以通过使用 kallsyms 来查找内核中特定符号的地址,或者通过解析内核符号的地址来确定符号的名称。 kallsyms 的使用 只需要在内核命令行中添加 kallsyms=1 即可。添加 kallsyms=1 后,内核将在启动时生成一个符号表,并将符号表存储在 /proc/kallsyms 文件中。 用户可以通过使用 cat 命令来查看 /pr...

阅读更多

CUDA Cores 和 Tensor Cores 区别

区别 CUDA Cores 和 Tensor Cores 是 NVIDIA GPU 显卡中的不同类型的处理单元,它们设计用来执行不同类型的计算任务。 CUDA Cores: CUDA Cores(Compute Unified Device Architecture Cores)是用于处理通用计算任务的核心。 它们是最基础的处理单元,能够执行浮点和整数操作,适用于各种计算密集型任务,包括图形渲染、科学计算和机器学习算法。 CUDA Cores 的设计侧重于提供高吞吐量的串行计算能力,适合广泛类型的通用计算任务。 Tensor Cores: Tensor Cores 是 NVIDIA 在其后代 GPU 架构(如 Volta、Turing 和 Ampere)中引...

阅读更多