compiler errors - If I tell NVCC to -gencode arch=native, what do I use for the code= argument? - Stack Overflow

Suppose my machine has GPUs with compute capabilities XX and YY. Having read:I know I can call nvcc lik

Suppose my machine has GPUs with compute capabilities XX and YY. Having read:

I know I can call nvcc like so:

nvcc \
    -o myapp \
    -gencode arch=compute_XX,code=sm_XX \
    myapp.cu

or like so:

nvcc \
    -o myapp \
    -gencode arch=compute_XX,code=sm_XX \
    -gencode arch=compute_YY,code=sm_YY \
    myapp.cu

for both GPUs. But - suppose I want to use the arch=native option, which we got a few years back, instead of specifying individual values. It should be easier and more straightforward, yet - I can't seem to get it right:

$ nvcc -o myapp -gencode arch=native myapp.cu 
nvcc fatal   : Option '--generate-code arch=native', missing code
$ nvcc -o myapp -gencode arch=native,code=sm_89 myapp.cu 
nvcc fatal   : Unsupported gpu architecture 'native'

Note: Using CUDA 12.6' version of NVCC.

Suppose my machine has GPUs with compute capabilities XX and YY. Having read:

https://stackoverflow/a/35657430/1593077

I know I can call nvcc like so:

nvcc \
    -o myapp \
    -gencode arch=compute_XX,code=sm_XX \
    myapp.cu

or like so:

nvcc \
    -o myapp \
    -gencode arch=compute_XX,code=sm_XX \
    -gencode arch=compute_YY,code=sm_YY \
    myapp.cu

for both GPUs. But - suppose I want to use the arch=native option, which we got a few years back, instead of specifying individual values. It should be easier and more straightforward, yet - I can't seem to get it right:

$ nvcc -o myapp -gencode arch=native myapp.cu 
nvcc fatal   : Option '--generate-code arch=native', missing code
$ nvcc -o myapp -gencode arch=native,code=sm_89 myapp.cu 
nvcc fatal   : Unsupported gpu architecture 'native'

Note: Using CUDA 12.6' version of NVCC.

Share Improve this question asked Nov 15, 2024 at 20:52 einpoklumeinpoklum 133k80 gold badges422 silver badges867 bronze badges
Add a comment  | 

1 Answer 1

Reset to default 1

It's actually easier than all that. Use:

nvcc -o myapp -arch=native myapp.cu 

without a -gencode argument.

Note that, as the CUDA Programming Guide states:

When -arch=native is specified, nvcc detects the visible GPUs on the system and generates codes for them, no PTX program will be generated for this option. It is a warning if there are no visible supported GPU on the system, and the default architecture will be used.

发布者:admin,转转请注明出处:http://www.yc00.com/questions/1745672035a4639462.html

相关推荐

  • 【合集】深入理解大容量SSD设计

    全文概览随着数据量的爆炸式增长,对SSD容量的需求也日益迫切。如何在有限的物理空间内,进一步提升SSD的存储容量,同时兼顾性能与成本,成为了业界亟待解决的关键问题。本文深入探讨了SSD架构设计中的核心要素——间接单元(IU)和动态随机存取存

    1小时前
    00
  • C#高性能开发之类型系统:从C# 7.0 到C# 14的类型系统演进全景

    自C# 7.0以来,C#语言在类型系统方面引入了众多新数据类型、类型构造和语言特性,以提升性能、类型安全性和开发效率。本文全面整理了从C# 7.0到C# 14.0(截至2025年4月,C# 14.0为预览版)类型系统的新增内容,包括值元组、

    1小时前
    20
  • 拿自己的旧电脑搭建了个服务器!

    最近总是想搭建自己的网站,奈何皮夹里空空如也,服务器也租不起,更别说域名了。于是我就寻思能否自己搭建个服务器,还不要钱呢?还真行!!!经过几天的冲浪,我发现有两个免费的建站工具:Apache和Nginx由于两个工具建站方法差不多,所以我就以

    1小时前
    00
  • 我把AI接上了Figma、WhatsApp、浏览器……然后它开始自己动起来了!

    大家好,你有没有幻想过这样一幕:你家的 AI 助手,突然接过你的手机,自己发了条微信。 紧接着,它点开了 Chrome,滑动了几下网页,做了个表单提交。然后它打开了 Figma,开始画 UI 界面。 最后,它还用自己的声音给人打了个电话,说

    1小时前
    00
  • 蜜罐检测

    核心功能功能模块技术实现URL去重输入文件哈希去重+结果文件增量校验智能限速令牌桶算法(支持动态时序调整)并发控制ThreadPoolExecutor线程池管理异常处理7大类错误分类统计(含QUIC协议错误) 蜜罐识别Cookie检测+备注

    1小时前
    00
  • 从 Arc,Dia,Fellou之后,一码难求,AI 的风刮到了浏览器?

    下午,偶然在群里看到有朋友在问,有没有Dia的邀请码......这是个什么产品??我查了下,原来是将AI与浏览器结合的产品。还有最近爆火的Fellou,也是一个将Agent与浏览器结合起来的东西。自manus之后,浏览器(browser-u

    1小时前
    00
  • 鸿门宴讲PostgreSQL

    最近有点忙,被一个老师联系,说周日紧急救场。说是有一个大央企要做一节PostgreSQL的课,PPT都写好了,就让我去讲一讲就可以了。我这人好面子,紧急救场去吧,也没想太多。从此有意思的故事就开始了,因为要伪装成这家委托我企业的员工,资深的

    1小时前
    00
  • OFC 2025三菱报告:高速EML的结构设计和封装优化

    一、AI集群发展催生光互连技术需求从市场趋势来看,AI集群对光收发器的需求呈现出强劲的增长态势。AI Scale out网络中光收发器数量持续攀升,同时,预计从2028年起,AI Scale up市场也将迎来爆发 ,这使得光收发器的需求

    1小时前
    00
  • 动态渲染页面智能嗅探:机器学习判定AJAX加载触发条件

    爬虫代理本文提出了一种基于机器学习的智能嗅探机制,革新性地应用于自动判定动态渲染页面中AJAX加载的最佳触发时机。系统架构采用先进模块化拆解设计,由请求分析模块、机器学习判定模块、数据采集模块和文件存储模块四大核心部分构成。在核心代码示例中

    59分钟前
    00
  • Ascend 910b vllm运行报错: cannot import name 'log' from 'torch.distributed.elastic

    在Ascend 910b上运行vllm报错. ImportError: cannot import name 'log' from 'torch.distributed.elastic.

    57分钟前
    00
  • WIFI越近信号越强?CST电磁仿真看看

    在数字化浪潮席卷的现代社会,WiFi 早已深度融入日常生活与工作场景,成为不可或缺的关键要素。凭借便捷连接、高速传输的显著优势,WiFi 不仅重塑了人们的生活模式,还极大提升了工作效率。如今,无论是繁忙的办公室、温馨的餐厅,还是疾驰的交通工

    56分钟前
    00
  • 高效开发必备!小程序组件复用的实用技巧

    高效开发必备!支付宝小程序组件复用的实用技巧

    53分钟前
    00
  • Vue 虚拟 DOM 的本质与引入原因详解及示例代码

    Vue里的虚拟DOM是一种对真实DOM的抽象表示,其结构通常为一个 JavaScript 对象,其内保存了DOM节点的标签、属性、子节点等信息。这种抽象表示能够在内存中高效地进行更新与比较,从而在数据发生改变时,只对需要更新的部分进行真正的

    51分钟前
    00
  • Xinstall APP安全加速SDK上线:拒绝卡顿、无惧攻击

    你的 APP 是否遇到过这些场景:用户抱怨 APP 加载缓慢、操作卡顿,尤其在网络高峰期或信号不佳时?重要推广活动期间,服务器突遭 DDoSCC 攻击,导致服务中断、用户无法访问?担心用户数据在传输过程中被窃取、篡改,引发隐私安全风险和信

    48分钟前
    00
  • Rust 现状全揭示:开发者生产力提升,信心却在下滑?

    作者 | Tim Anderson 译者 | Sambodhi 策划 | Tina图片2024 年 Rust 现状调查结果已经发布,显示生产力有所提升,但编译慢和调试困难仍然是重大挑战。另一个令人关注的问题是,尽管 Rust

    36分钟前
    00
  • 【一步步开发AI运动APP】八、自定义姿态动作识别检测——之姿态相似度比较

    之前我们为您分享了【一步步开发AI运动小程序】开发系列博文,通过该系列博文,很多开发者开发出了很多精美的AI健身、线上运动赛事、AI学生体测、美体、康复锻炼等应用场景的AI运动小程序;为了帮助开发者继续深耕AI运动领域市场,今天开始我们将为

    22分钟前
    00
  • .NET 9版本支持说明

    在深入探讨.NET 9库的激动人心改进前,有必要了解微软对.NET版本的支持策略。• 奇数版本(如.NET 9):属于标准期限支持(STS),提供18个月支持周期,适合尝试前沿功能。• 偶数版本(如.NET 8或未来的.NET 10):提供

    21分钟前
    00
  • 深入微服务核心:从架构设计到规模化

    《Building Microservices》这本书是吃透微服务的大部头,本文基于全书内容,系统性地阐述了微服务架构的设计原则、实施策略与挑战,从微服务的核心概念出发,延伸到架构设计、服务拆分、集成技术及规模化实践,为开发者提供了构建稳健

    12分钟前
    00
  • UML 2.0中的14种图简介

    UML(统一建模语言)2.0中定义了14种不同类型的图表,用于从不同角度描述系统。这些图表分为结构图和行为图两大类。可使用 PlantUML 绘制 UML 中的各种类型的图表: PlantUML是一个通用性很强的工具,可以快速、直接地创建

    9分钟前
    00
  • Sentieon软件发布v202503版本

    Sentieon最新版本V202503Sentieon团队持续优化升级产品,现已发布v202503版本。本文将详细介绍此次更新中的重要功能改进和问题修复,以帮助您更好地了解和使用最新版本。图1Sentieon V202503版手册目录

    2分钟前
    00

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信