FC 16Gbps 是否有LOOPps混合模式在哪

点击联系发帖人 时间：2018-04-12 14:40

ps图层混合模式

16Gb FC_IT168
网络连接、监控和管理领域的领导者 Emulex 公司日前宣布将为联想ThinkServer机架式和塔式服务器提供万兆以太网(10GbE)和第五代光纤通道(16GFC)高性能连接。全新OneConnect OCe14000系列10GbE适配器、融合网络适配器(CAN)以及LightPulse LPe16000第五代光前通道主机总线适配器(HBA) 将进一步助力联想Thi
几年前，每秒输入/输出操作数(IOPS)突破10万次都可以说是惊人的事件;但是就在最近，Storage Switzerland与博科(无编码开发技术全球领导厂商)、戴尔、Violin Memory(闪存厂商)和Emulex合作进行了实验室测试，在广泛采用现有组件搭建的简单的存储区域网络(SAN)上，实现了230万IOPS。
简答来说，两地三中心整体灾难恢复解决方案通过同城灾备+异地灾备的方式实现，在同城方面，Infortrend ESDS3000系列高性能存储系统被部署在同城两个可独立承担关键系统运行的数据中心，通过光纤通道快速实时的进行数据镜像，可实现生产与灾备中心之间数据的实时复制和应用的快速切换。值得一提的是，In
光纤通道(FC)适配器行业领导厂商QLogic宣布，其备受赞誉的QLogic FlexSuite现可用于NetApp下一代存储阵列，能为块级和文件级存储访问提供Gen 5 FC和10Gb以太网(10GbE)等多协议连接。QLogic FlexSuite技术让NetApp客户可以通过一个简单的升级操作，自由选择存储协议，并在未来的转型中切换成另一种I/O选
如果您正在寻找完美的低延时、高性能存储、闪存缓存和第五代光纤通道HBA解决方案，那么您不必再苦苦寻觅了，因为EMC产品可以帮您实现。
　　配备有EMC认证的第五代光纤通道LPe16000B-E系列HBA的EMC VNX8000和XtremSW Cache提供了一种更强大的整体存储解决方案，它可以支持在线事务性能工作负载(OLTP)和
说到这方面，我生活中有两个挚爱――16Gb光纤通道(16GFC)PCI Express(PCIe)通用主机总线适配器(HBA)和健康的生活(比如经常锻炼、营养均衡)。如果我生命就剩最后一天，而让我选择如何度过这一天的话，我首先会去阅读最新的使用案例，看看部署光纤通道(FC)HBA的客户是如何在自己的数据中心里实现最高的每
早些时候，我们宣布推出了PCI Express (PCIe) 3.0 HP StoreFabric SN1100E 16Gb光纤通道主机总线适配器(HBA)。这款HBA它可以提供出色的IOPS性能――比其他第五代HBA高出20%，再加上快如闪电的响应时间和高出4倍的每瓦特IOPS性能，都使我们的第五代HBA成了要求最苛刻的虚拟化、云和关键任务部署的理想选
FC适配器行业领导者QLogic今天宣布，QLogic屡获殊荣的FlexSuite 2600系列16Gb Gen 5 FC适配器现在可以用于华为的Tecal RH系列机架服务器和X系列数据中心服务器。QLogic与华为的持续合作，再一次贯彻了QLogic致力于为中国和全球高速增长的IT市场提供最新高性能连接解决方案的宗旨。
随着IT企业越来越广泛地使用虚拟化，一方面整合了服务器基础架构并提供了更高的可用性，减少了电力、冷却和管理成本，另一方面却产生了I/O瓶颈。并且虚拟数据中心这一迅猛增长的势头还推动了对FC存储的需求以及16Gb Gen 5 FC SAN的普及。
网络连接、监控和管理领域的全球领导者Emulex公司日前宣布推出面向基于全新英特尔?至强TM处理器E5-2600 v2产品家族的全新惠普ProLiant Gen8服务器广泛I/O连接解决方案。惠普 ProLiant Gen8创新旨在提高虚拟化环境的性能，提供优化数据中心效率所需的智能功能。
Infortrend正式宣布推出全球首款16G FC主机接口存储解决方案。新的16G FC产品是今年初上市的EonStor DS G7i高效能系列中的新主机接口选择，沿用EonStor DS G7i系列优良的硬件设计并在性能上有重大突破。Infortrend此次一举推出多达8款新品，以完整的产品选择来满足更广泛的存储应用需求。让中小型企业及
网络连接、监控和管理领域的领导者Emulex公司(NYSE:ELX)日前宣布，Emulex LightPulse LPe16000B-M6-F单端口和LPe16002B-M6-F双端口16Gb光纤通道(16GFC)主机总线适配器(HBA)已被富士通PRIMERGY系列服务器采用。Emulex 16GFC HBA可以在单端口上实现每秒120万次I/O操作(IOPS)1，能够帮助富士通用户在每台服
对于博科而言，在光纤领域似乎并没有太多过于强大的对手，对于任何一个行业而言，占据70%的市场份额似乎是一件天方夜谭的事情，但在FC-SAN领域，博科确确实实做到了。当然，这并不意味着博科就没有竞争对手，其最大的竞争可能来自于以太网市场。但从目前看来，尽管以太网发展轰轰烈烈，但现在还不会给光
Emulex公司日前宣布，昆腾公司(Quantum)、DataCore Software、GreenBytes、Pure Storage、和X-IO等全球众多合作伙伴已采纳了LightPulse?16Gb光纤通道(16GFC)主机总线适配器(HBA)，来实现联合虚拟化、闪存，以及数据归档和备份解决方案。最新研究表明：Emulex 16GFC HBA是当今OEM厂商最广泛采用的16GFC
戴尔的Compellent和博科、Emulex和QLogic一起提供了第一个端到端的16G FC存储网络设置，加速对SAN数据的访问。
随着FCoE技术从实验室和概念状态转向真实的市场，一个重要的问题冒了出来，那就是新生的FCoE市场是更倾向于光纤通道(FC)还是以太网(E)呢?
在经历销售业绩平淡的第四季度以及2880万美元的损失后，Emulex寄希望于16Gbps光纤通道主机总线适配器(HBA)。
日前，Emulex公司推出了第9代光纤通道适配器LPe16000。新的LPe16000HBA是业内首款4端口融合光纤架构控制器，可支持万兆以太网、16GB FC和最高40GB以太网的网络融合。单一端口上支持每秒100多万I/O(IOPS)的处理速度，为高密度关键任务云数据中心和虚拟化数据中心提供高性能I/O。
最近完成的16G光纤通道(16GFC)标准加倍提高了光纤通道物理接口的速度，从原来的8Gbps提高到16Gbps，数据吞吐率也实现了翻倍列表网公众号列表活动随时有扫我活动不错过
下次自动登录(公共场合慎用)
使用合作网站账号登录：
收藏成功！
您可在个人中心，查看
类&&&&别：
起订数量：
商家地址：
北京海淀区西直门外联慧路99号,海云轩C
查看联系方式
查看联系方式
联系我时说明在列表网看到，说不定有意外惊喜哟！
微信扫一扫，快速拨打电话
设备类型：光纤交换机
传输模式：全/半双工自适应
端口数：16口-48口
模块化插槽数：1
BROCADE 6505交换机&BR-RBR
SFPS,BR,AC,SINGLE PSUBR-G-0RBR Gb SFPS,BR,AC,SINGLE PSUBR-G-1RBR Gb SFPS,ENT,BR,AC,SINGLE PSUBR-SMED12POD-01S/W,PORT-ON-DEMAND,12-PORTSXBR-SMED12POD-16GS/W, 12 PORT-ON-DEMAND,WITH 12 BR 16G SWL SFPS&数据中心：面向私有云存储的灵活、简便易用的入门级SAN交换机主要特性&&&&&&&提供超高的性价比，在24端口1U高入门级交换机中结合出色的灵活性、简便性和企业级功能&&&&&&&&&&&&&&&利用按需端口扩展（PoD）功能，快速、简单而经济高效地从12&&个端口扩展到&&&&&&&& 24个&&&&&&&&&&&&&利用平滑的软件升级和可选的冗余电源最大限度地提高弹性&&&&&&&&&&&&&利用Brocade EZSwitchSetup向导简化部署&&&&&&&&&&&&借助动态Fabric配置、关键性能监控和高级诊断特性简化部署和故障排除，缩短时间&&&&&&&提供双重功能，既可用作功能全面的Fabric SAN交换机，又可用作支持&&& NPIV&&&&&&&&的Brocade & Access Gateway，进而简化服务器连接，提高&&&&&& SAN&可扩展性&&&&&&&通过Brocade Network Advisor简化并集中进行管理，降低运营成本和复杂性&&&Brocade&& One&战略可通过创新的技术和解决方案简化网络基础架构。Brocade& 6505交换机可通过在灵活、经济高效而且简便易用的1U机型中提供出色的性价比来帮助实施这一战略。为满足不断增长的业务需求，数据中心正迁移到高度虚拟化的私有云存储环境。这种方法使企业可以整合并简化IT资源，进而提高业务灵活性并降低资本支出和运营支出。但伴随虚拟化而来的还有一系列挑战。数据中心必须适应爆炸性数据增长和虚拟化工作负载驱动的动态变化。要实现这些基于云的架构的全部优势，选择适当的网络是关键。BROCADE&6505交换机可提供超高的性价比，将出色的灵活性、简便性和企业级功能无缝地结合到一台入门级交换机中。BROCADE&&&&&&&& 6505设计用于实现最高的灵活性和可靠性，有12或24端口两种配置，而且可在高效的&&&&&& 1U包装中支持2、4、8或16GBPS的速度。它标配有带集成风扇的单一电源。可选的第2套电源可提供更高的冗余，来确保更高的弹性。简化的部署流程和点击式用户界面使BROCADE6505更加强大而且简便易用。此外，BROCADE&&&&&& 6505可帮助以很低的成本获得行业领先的存储区域网络（SAN）技术的优势，同时提供&边增长边付费&式可扩展性，来满足不断发展演进的存储环境的各种需求。通过诊断端口（DIAGNOSTIC PORT）加速FABRIC架构部署诊断端口（D_Ports）是一种新的端口类型，可帮助管理员快速发现并隔离光纤和电缆故障，从而缩短光纤部署和诊断时间。企业还可以使用D_Ports来通过BrocadeNetwork Advisor（博科网络顾问软件）或命令行界面（CLI）进行各种测试，来测试并检测端口、Small Form-Factor Pluggables（SFP）和线缆故障、延时和距离。利用DYNAMIC FABRIC PROVISIONING（动态FABRIC架构配置）简化服务器部署在添加或更换服务器时，Dynamic Fabric Provisioning（DFP）允许企业通过主机全球名称（WWN）虚拟化来避免&&&&&&&& Fabric架构重新配置。它还可以降低甚至从根本上消除修改分区或逻辑单元号（LUN）掩码的需求。此外，DFP可支持虚WWN的预先配置（pre-provisioning），在企业部署新设备或在交换机中移动设备时避免耗时的步骤。超高的性价比，支持不断增长的SAN工作负载BROCADE&&&&&&&& 6505集市场领先的吞吐量和经济的交换机外形设计于一身，是应对不断增长的&&&&&&& SAN&工作负载的理想选择。24&&&&个端口可提供总共384 GBPS的全双工吞吐量；可将任意8个端口捆绑起来，形成&&&&& 128GBPS&的互联链路捆绑（INTER-SWITCHLINK，ISL）。基于交换的动态路径选择（DPS）可以优化全&&&&&&&& FABRIC&&&&架构的性能，并通过自动将数据路由到架构内最高效的空闲路径上来实现负载均衡（见图1）。它可以进一步补充BROCADE&&&& ISL链路捆绑，在特定配置中提供更有效的负载均衡。此外，BROCADE&&& 6505的总体拥有成本（TCO）很低，因为它的12&端口基本配置易于管理，只占用1U的机架空间而且能耗很低&&每GBPS为0.22瓦，每端口为3.3瓦。企业级功能与很低的TCO&&相结合，与成本相当的同类其它万兆以太网（10GBE）解决方案相比可提供高40%&&&&&的性能。&&&&&&&&行业领先的技术，灵活、简单而且简便易用BROCADE&&&&&&&& 6505在灵活、简单而且简便易用的解决方案中提供行业领先的&&& SAN&技术。基本配置包含12个端口，可根据需要最多扩展到&&&& 24个端口。除了提供最高的可扩展性之外，BROCADE&& 6505还可以通过BROCADE&&&&&&&& EZSWITCHSETU向导和可简化设置的全新&D_PORT&特性来实现轻松部署。&&&&虚拟化私有云存储的有机组成部分Brocade&& 6505为当前的高度虚拟化私有云存储环境提供了一个关键组件。它可以简化服务器虚拟化和虚拟桌面基础架构（VDI）管理，同时满足固态硬盘（SSD）的高吞吐量需求。Brocade&&&&&&& 6505还可以通过服务质量（QoS）和基于Fabric架构的分区特性来在云环境中支持多租户（multi-tenancy）。&BROCADE ACCESS GATEWAY（接入网关）模式Brocade6505可作为功能全面的&& Fabri架构交换机或作为Brocade Access&&&&&&&& Gateway（接入网关）进行部署，来简化& Fabric架构拓扑和异构Fabric架构连接（其默认模式设置是交换机）。AccessGateway&&&&&&模式利用N_Port ID Virtualiza tion（NPIV）交换机标准来直接向SAN Fabric架构的核心显示物理和虚拟服务器。这使Access&&&& Gateway对SAN Fabric&架构完全透明，因此可大大减轻网络边缘的管理工作。Access&&&&& Gateway&模式*下的Brocade6505可以将服务器连&&&&&接到支持NPIV的Brocade B系列、Brocade&&&&&&& M系列或其它SAN Fabric架构。企业可以通过Brocade& Network& Advisor（博科网络顾问软件）或CLI轻松实现Access Gateway&&&&模式。Access&&&&&&&& Gateway模式的主要优势包括：&&&&&&&更高的可扩展性，适合大型或快速增长的服务器和虚拟服务器环境&&&&&&&&&&&&&&&减少网络边缘的管理工作，因为Access& Gateway&没有域身份，在核心Fabric架构看来是完全透明的&&&&&&&&&&&&&&支持异构SAN配置，而不减少服务器连接功能&&&在入门级交换机中提供企业级特性Brocade&& 6505在入门级交换机中提供先进的监控、诊断、RAS和冗余功能，来最大限度地提高可用性，优化性能并简化管理。这些企业级特性包括：&&&&&&&关键的诊断和监控功能，可帮助确保尽早完成故障检测和恢复&&&&&&&在每个端口上支持平滑、非破坏性监控，提供整个Fabric架构的端到端视图&&&&&&&&&前向纠错（FEC）可从ISL&&中的位错误中恢复，进而增强传输可靠性和性能&&&&&&&额外的缓冲器，可避免缓冲信用丢失导致的性能降低和拥塞&&&&&&&&&&&在& ISL上根据主机/应用进行实时带宽消耗量计算，识别热点和潜在的网络拥塞&&&&&&&可选的第2套电源，实现双电源冗余，增强可用性&&&&&&博科全球服务Brocade&& Global Services（博科全球服务）有着全面的专业技术来帮助企业构建可扩展而且高效的云计算基础架构。利用15年的存储、网络连接和虚拟化经验，博科全球服务可提供全球一流的专业服务、技术支持、网络监控和培训服务，帮助企业最有效地利用他们对博科产品的投资，加快新技术部署并优化网络基础架构的性能。最有效地利用投资为了帮助客户更有效地利用技术投资，博科及其合作伙伴可提供全面的解决方案，包括专业服务、技术支持和培训。BROCADE 6505规格系统架构光纤通道端口交换机模式（默认）：12和24端口配置（可通过按需端口扩展[PoD]许可证，以12端口的增量增加）；通用（E、F、M和D）端口Brocade& Access Gateway（接入网关）默认端口映射：16个F_Port，8个N_Port可扩展性功能全面的Fabric架构，最多可有239台交换机标准最大支持数Brocade&& Fabric OS& Fabric&&&&架构中6000个活动节点、56台交换机和19跳；Brocade&&&&&&&& M-EOS Fabric&&架构中31台交换机和3跳；较大型&&&& Fabric架构可按需配置性能2、4、8&和16Gbps端口速率自适应ISL链路捆绑基于帧的链路捆绑，每条ISL捆绑链路最多8个16 Gbps端口；每条ISL捆绑链路最高128Gbps吞吐量。运用Brocade Fabric&&&&& OS中所包括的DPS，实现基于交换的跨ISL负载均衡。对交换机中可以配置的捆绑链路组数量没有限制。总带宽384& Gbps的端到端全双工带宽&&最大&&&&&&&& Fabric&&&&&&架构延时本地交换端口延时为700ns；E_Ports间前向纠错（FEC）会增加400& ns（默认启用）。最大帧2112字节净负荷帧缓冲8192，动态分配&服务等级Class2、Class 3、Class& F（交换机间帧）端口类型D_Port（诊断端口）、E_Port、F_Port、M_Port（镜像端口）；基于交换机类型的自我发现（U_Port）；可选的端口类型控制Brocade&& Access Gateway模式：F_Port和支持NPIV&&&&&&&&技术的N_Port数据流量类型Fabric&&&&&&架构交换机支持单播流量&介质类型可热插拔、行业标准的Small&&&& Form-Factor&&&& Pluggable（SFP+）、LC接头；短波（SWL）；长波（LWL）；超长波（ELWL）；最大距离取决于光缆类型和端口速度。支持SFP+（8和16Gbps）光收发器。USB&接口1个USB&口，用于系统日志文件下载或微码升级Fabric架构服务注：有些Fabric&&&&&服务不适用或在Brocade Access Gateway模式下不可用。博科高级性能监控（包括E_Ports、F_Ports和Fabric模式的最高用量者）；博科适应性网络（入站速率限制、流量隔离、QoS）；瓶颈检测；博科高级分区（默认分区、端口/WWN分区、广播分区）；Dynamic Fabric Provisioning（DFP）；动态路径选择（DPS）；Brocade&& Extended Fabrics；Enhanced BB&&& Credit&&&&&&恢复；Brocade Fabric Watch；FDMI；帧重定向；基于帧的链路捆绑；FSPF；IPoFC；Brocade&& ISL&&&链路捆绑；管理服务器；NPIV；NTPv3；Port Fencing；注册状态变更通知（RSCN）；Reliable&&&&&&&&& Commit Service（RCS）；服务器应用优化（SAO）；简单名称服务器（SNS）管理支持的管理软件HTTP、SNMP& v1/v3（FE MIB、FC Management MIB）、SSH；审核、系统日志；Brocade&&&& Advanced Web工具、高级性能监控、Brocade&& Fabric Watch；Brocade& Network& Advisor SAN Enterprise或Brocade Network Advisor& SAN& Professional/ Professional&&&& Plus；命令行界面（CLI）；符合SMI-S&&标准；管理域；面向插件功能的试用版许可证安全性DH-CHAP（交换机和终端设备间）、FCAP&&交换机身份验证；符合FIPS& 140-2 L2&&标准、HTTPS、IPsec、IP&过滤、LDAP&&& with IPv6、端口绑定、RADIUS、用户定义的基于角色的访问控制（RBAC）、Secure& Copy（SCP）、Secure&&& RPC、SFTP、SSH&&&& v2、SSL、交换机绑定、Trusted Switch管理访问10/100&&&& Mbps以太网（RJ-45）接口，通过光纤通道实现带内管理，1个串口（RJ-45），1个USB&&&&&&&&口诊断D_Port&&&&离线诊断，包括电/光环回、链路流量/延时/距离；POST和内嵌式在线/离线诊断，包括环境监控、FCping和Pathinfo（FC traceroute）、Frame&&&& Viewer、非破坏性Daemon重启、端口镜像、光纤组件健康状况监控、电源监控、RAStrace日志和Rolling&&&&&&& Reboot&&&& Detection（RRD）机械参数外壳后前通风（端口测排风）；后端供电，1U尺寸宽：437.64&&&&&毫米（17.23&&英寸）高：43.18&&&&&&&毫米（1.7&&&&&&&英寸）深：443.23&&&&&毫米（17.45&&英寸）系统重量7.82千克（17.25&&磅），一套电源，无收发器9.16千克（20.19&&磅），双电源FRU，无收发器环境运行环境&&&&&&&&温度：0&C到40&C /32&F&&到104&F&&&&&&&&湿度：10%&&&&&到&&&& 85%，无冷凝非运行环境温度：-25&C到& 70&C&&& /&13&F到158&F湿度：10%到90%，无冷凝运行海拔最高3000米（9843英尺）储存海拔&&&&&&&&最高12000米（39,370&&&&&&&&英尺）冲击运行：20克，6毫秒，半正弦&&&&非运行：半正弦，33克，11毫秒，3/eg&& Axis震动运行：0.5克&正弦，0.4grms&&&&随机，5Hz至500Hz非运行：2.0克正弦，1.1grms&&随机，5Hz至500Hz散热24&&&&个端口：338& BTU/hrPower电源基本配置交换机包含一套带集成系统冷却风扇的可热插拔电源。可选的双冗余可热插拔电源AC&&&输入85V&到264V，~5A到&&& 2.5A输入线频率47Hz到63Hz功耗所有24个端口都安装&& 16Gbps SWL光模块时为80&&瓦，未安装光模块的空机箱为60瓦&&&
联系我时，请说是在列表网栏目上看到的，谢谢！
小贴士：brocade6505系列交换机博科16Gbps信息由列表网网友发布，其真实性及合法性由发布人负责。列表网仅引用以供用户参考。详情请阅读列表网免责条款。
请在查看您收到的留言
手机号码：
获取确认码
已发送（59）
所在城市：
留言内容：
快捷留言：
想了解一下详情，请尽快联系我。
我对您的商品感兴趣，请尽快和我联系。
brocade6505系列交换机博科16Gbps 相关广告
&2017 列表网&琼ICP备号-12&增值电信业务经营许可证B2-&1710人阅读
个人觉着RFCN系列的工作还是非常好的，所提出的position sensitive score maps 非常有启发性，包括本文的一些工作都是有很高的价值的。
主要涉及的论文
[1] Instance-sensitive Fully Convolutional Networks
[2] R-FCN: Object Detection via Region-based Fully Convolutional Networks
[3] Fully Convolutional Instance-aware Semantic Segmentation
1. Position sensitive score maps
以往featuremap 直接根据输入进行学习，每个channel所学习的特征对应位置都是同一像素的映射，而本文提出的position-sensitive score maps，每个channel所学习的特征都与不同的位置相关。
在R-FCN中：
具体请看之前的，Position sensitive score maps 共k2(C+1)个，之后的RoI pooling,对每个相应位置的score 求平均得到C+1个channel的结果，最后的vote也是在相应通道上求平均。
而在fcis中：
原本k2(C+1)，变为了 2k2(C+1)，这里的2，是将原来的一个score map 变为了inside score map+outside score map，经过position sensitive RoI pooling之后变为 2(C+1)。
fcis bbox regression 得到的channel是 4k2(C+1)也是通过average vote。
2 Joint Mask Prediction and Classification
如何利用这里的2(C+1) score maps是这部分的重点：
首先对于classification:
classification首先进过Grope_max的操作，输出【num_rois, group,h,w】维数据，得到的是inside和outside之间的最大值，然后将经过softmax进入loss，inference的时候同样得到一个softmax的class的prob。
下面的代码，不想看的请略过。
psroipool_cls = mx.contrib.sym.ChannelOperator(name='psroipool_cls', data=psroipool_cls_seg, group=num_classes, op_type='Group_Max')
cls_score = mx.sym.Pooling(name='cls_score', data=psroipool_cls, pool_type='avg', global_pool=True, kernel=(21, 21))
cls_score = mx.sym.Reshape(name='cls_score_reshape', data=cls_score, shape=(-1, num_classes))
namespace cuda {
template &typename DType&
__global__ void GroupMaxForwardKernel(
const int count,
const DType* bottom_data,
const int channels,
const int group,
const int channels_in_group,
const int spatial_dim,
DType* top_data,
DType* max_idx_data) {
CUDA_KERNEL_LOOP(index, count) {
int s = index % spatial_
int g = (index / spatial_dim) % group;
int n = index / spatial_dim / group;
DType max_val = -FLT_MAX;
int max_idx = -1;
for (int i = 0; i & channels_in_ ++i) {
int c = g*channels_in_group +
int bottom_index = (n*channels + c)*spatial_dim +
if (bottom_data[bottom_index]&max_val) {
max_val = bottom_data[bottom_index];
top_data[index] = max_
max_idx_data[index] = max_
template&typename DType&
inline void GroupMaxForward(const Tensor&gpu, 4, DType& &out,
const Tensor&gpu, 4, DType& &data,
const Tensor&gpu, 4, DType& &max_idx,
const int group) {
const DType *bottom_data = data.dptr_;
DType *top_data = out.dptr_;
DType *max_idx_data = max_idx.dptr_;
const int count = out.shape_.Size();
const int channels = data.size(1);
const int height = data.size(2);
const int width = data.size(3);
const int spatial_dim = height *
const int channels_in_group = channels / group;
cudaStream_t stream = Stream&gpu&::GetStream(out.stream_);
GroupMaxForwardKernel&DType& && &mxnet::op::mxnet_op::cuda_get_num_blocks(count),
kBaseThreadNum, 0, stream && &(
count, bottom_data, channels, group,
channels_in_group, spatial_dim, top_data, max_idx_data);
ChannelOperator_CUDA_CHECK(cudaPeekAtLastError());
其次，对于mask：
mask在train时,进过Label_Pick得到的是ground truth类别的inside和outside score map，输出shape为：【num_rois, 2, h, w】，然后求softmax loss。
label_seg = mx.sym.Reshape(name='label_seg', data=label, shape=(-1, 1, 1, 1))
seg_pred = mx.contrib.sym.ChannelOperator(name='seg_pred', data=psroipool_cls_seg, pick_idx=label_seg, group=num_classes, op_type='Group_Pick', pick_type='Label_Pick')
template &typename DType&
__global__ void GroupPickForwardKernel(
const int count,
const DType* bottom_data,
const int channels,
const int group,
const int channels_in_group,
const int spatial_dim,
DType* top_data,
const DType* pick_idx_data) {
CUDA_KERNEL_LOOP(index, count) {
int s = index % spatial_
int c = (index / spatial_dim) % channels_in_
int n = index / spatial_dim / channels_in_
int g = pick_idx_data[n];
int bottom_index = (n*channels + g*channels_in_group + c)*spatial_dim +
top_data[index] = (g & group && g &= 0) ? bottom_data[bottom_index] : DType(0);
template&typename DType&
inline void GroupPickForward(const Tensor&gpu, 4, DType& &out,
const Tensor&gpu, 4, DType& &data,
const Tensor&gpu, 4, DType& &pick_idx,
const int group) {
const DType *bottom_data = data.dptr_;
DType *top_data = out.dptr_;
const DType *pick_idx_data = pick_idx.dptr_;
const int count = out.shape_.Size();
const int channels = data.size(1);
const int height = data.size(2);
const int width = data.size(3);
const int spatial_dim = height *
const int channels_in_group = channels / group;
cudaStream_t stream = Stream&gpu&::GetStream(out.stream_);
GroupPickForwardKernel&DType& && &mxnet::op::mxnet_op::cuda_get_num_blocks(count),
kBaseThreadNum, 0, stream && &(
count, bottom_data, channels, group,
channels_in_group, spatial_dim, top_data, pick_idx_data);
ChannelOperator_CUDA_CHECK(cudaPeekAtLastError());
inference 的时候没有groundtruth，会先经过Group_Softmax，然后经过Score_Pick.
group_softmax输出为[num_rois, c, h, w]，其前传函数为Softmax(out, data)，
score_pick 分为GetMaxIdx与GroupPickForward两部分,第一部分选取最可能的类别，
score_seg = mx.sym.Reshape(name='score_seg', data=cls_prob, shape=(-1, num_classes, 1, 1))
seg_softmax = mx.contrib.sym.ChannelOperator(name='seg_softmax', data=psroipool_cls_seg, group=num_classes, op_type='Group_Softmax')
seg_pred = mx.contrib.sym.ChannelOperator(name='seg_pred', data=seg_softmax, pick_idx=score_seg, group=num_classes, op_type='Group_Pick', pick_type='Score_Pick')
template &typename DType&
__global__ void GetMaxIdxKernel(
const int count,
const DType* pick_score_data,
DType* argmax_data,
const int group) {
CUDA_KERNEL_LOOP(index, count) {
const DType* offset_pick_score_data = pick_score_data + index*group;
int max_idx = -1;
DType max_val = -FLT_MAX;
for (int i = 1; i & group; ++i) {
max_idx = offset_pick_score_data[i] & max_val ? i : max_
max_val = offset_pick_score_data[i] & max_val ? offset_pick_score_data[i] : max_
argmax_data[index] = static_cast&DType&(max_idx);
template&typename DType&
inline void GetMaxIdx(const Tensor&gpu, 4, DType& &pick_score,
const Tensor&gpu, 4, DType& &argmax,
const int group) {
const DType *pick_score_data = pick_score.dptr_;
DType *argmax_data = argmax.dptr_;
const int count = argmax.shape_.Size();
cudaStream_t stream = Stream&gpu&::GetStream(argmax.stream_);
GetMaxIdxKernel&DType& && &mxnet::op::mxnet_op::cuda_get_num_blocks(count),
kBaseThreadNum, 0, stream && &(
count, pick_score_data, argmax_data, group);
ChannelOperator_CUDA_CHECK(cudaPeekAtLastError());
translation invariant是没有positive sensitive的情况，separate score maps是不共用一个score maps 的情况。
文章：11篇
阅读：60312
文章：10篇
阅读：32911}

常信村百科网