1.目标检测常用数据集格式
2.GroupSoftmax:利用COCO和CCTSDB训练83类检测器
3.懂编程的源码来
4.coco编程是什么意思?
5.mmdetection框架和工程实践
目标检测常用数据集格式
我们常需利用标注工具如LabelImg、LabelMe等制作数据集,源码或使用开源数据集进行目标检测模型训练。源码这些数据集格式多样,源码不具一致性,源码目标检测数据格式又相对复杂。源码动态psd源码因此,源码为兼容框架和源码,源码我们通常需将自定义数据集转换为标准格式,源码如COCO格式和VOC格式,源码这两种格式因其知名度和解析库而广受欢迎。源码许多开源数据集都提供格式转换工具,源码而使用主流标注工具自行标注的源码数据集也已有许多成熟的开源转换代码。本文旨在介绍VOC和COCO数据集的源码格式,并说明如何组织数据集目录结构以方便转换。源码
PASCAL VOC数据集源自同名竞赛,始于年,结束于年。虽然不是特别大型的目标检测数据集,但在COCO诞生前,它是非常流行的目标检测任务基准数据集。主要数据集为VOC和VOC,它们的格式相同。以下以VOC为例进行说明。
根级目录下有5个目录:JPEGImages、Annotations、ImageSets、Layout和Action。JPEGImages目录存放所有,Annotations存放对应的XML标注文件,ImageSets文件夹下的txt文件用于数据集划分,Layout和Action文件夹分别按人体部位和动作类别分类。Segmentation文件夹存放分割数据集划分。对于通用目标检测任务,我们通常只需关注Main文件夹下的四个总体划分文件。
VOC数据集的标注格式中,最外层为annotation标签,包含图像所在文件夹、文件名、来源、图像尺寸等信息,以及多个object标签,每个标签包含一个目标对象的信息。
制作自定义VOC格式的数据集时,需构建三个文件夹:JPEGImages、Annotations和ImageSets/Main,其中Main文件夹存放train.txt、val.txt和test.txt等数据集划分文件。构建VOC格式数据集相对简单,因为LabelImg等工具生成的xml标注就是VOC格式所需的。
COCO数据集是微软构建的一个大型目标检测基准数据集,包括检测、分割、关键点估计等任务。本文以COCO数据集为例进行说明。COCO数据集的关键文件包括unlabeled、train、val、test和annotations文件夹。annotations文件夹包含各种类型的标注文件,如instances_train.json和instances_val.json。
COCO数据集的标注文件是json格式,包含info、licenses、images、categories和annotations五个部分。images部分包含信息,categories部分包含类别信息,annotations部分包含标注信息,如id、图像id、类别id、分割级别标注和边界框标注等。
构建COCO数据集时,只需生成子集文件夹和标注文件夹,标注文件夹每个json对应一个子集的标注。VOC和COCO格式也可以互相转换,转换代码可在Github上搜索。
YOLO格式虽然不常用,但其标注格式与VOC类似,为txt格式,每行包含一个目标框,空格分隔的数值代表目标框的位置和大小。
本文介绍了目标检测中常见的两种数据集格式,VOC和COCO,理解这些格式有助于使用目标检测源码和框架。
GroupSoftmax:利用COCO和CCTSDB训练类检测器
在CV领域,工程师常利用YOLO、Faster RCNN、CenterNet等检测算法处理业务数据,旨在优化模型性能。然而,当模型在实际业务中发挥作用时,CEO的质疑往往紧随而来。为解决这一问题,我们设计了GroupSoftmax交叉熵损失函数,以解决模型训练的三大挑战。该函数允许类别合并,形成新的组合类别,从而在训练时计算出各类别对应梯度,完成网络权重更新。宁夏源码加盟理论上,GroupSoftmax交叉熵损失函数兼容多种数据集联合训练。
我们利用了COCO和CCTSDB数据集,基于Faster RCNN算法(SyncBN),联合训练了一个包含类的检测器。在COCO_minival测试集上,使用GroupSoftmax交叉熵损失函数训练的模型在mAP指标上提升了0.7个点,达到.3,相比原始Softmax交叉熵损失函数,性能显著提升。此外,我们还训练了一个trident*模型,6个epoch在COCO_minival测试集上的mAP为.0,充分验证了GroupSoftmax交叉熵损失函数的有效性。
基于SimpleDet检测框架,我们实现了mxnet版本的GroupSoftmax交叉熵损失函数,并在GitHub上开源了源码。GroupSoftmax交叉熵损失函数的原理在于允许类别合并形成群组,计算群组类别概率的交叉熵损失,进而对激活值进行梯度计算。具体而言,当目标类别属于某个群组类别时,其梯度为群组类别梯度与子类别预测概率的比值。这样,GroupSoftmax交叉熵损失函数在处理类别合并情况时,能够有效更新网络权重。
实现GroupSoftmax交叉熵损失函数时,需要注意以下几点:
1. 对于未标注类别的数据集,可理解为与背景组成新的群组类别。
2. 在两阶段检测算法中,RPN网络应根据数据集特性调整为多分类,以适应模型训练需求。
3. 联合训练COCO和CCTSDB数据集时,最终分类任务为1+类,未标注类别的数据集可与背景组成组合类别。
4. 编写CUDA代码时,计算群组类别概率时,需加微小量避免分母为0导致的计算错误。
懂编程的来
各种语言的介绍(第二版)
在介绍编程语言之前,先说说开放源代码的必要性。现在,在软件生产领域存在巨大的智利浪费,大家把大量的精力用在编写别人已经实现的 程序代码上。看看,文本编辑器有多少,看看ftp程序有多少,看看字处理程序有多少,这些程序虽然有差别,但主要的功能都是一样的。要实 现个性化的功能,在已有的软件基础上修改会节省多少时间呀!而每个程序各编一套,又浪费多少时间?如果,没有这些重复的工作量,世界 上的程序员至少可以节省%的工作量。同时,开放源代码也方便了大家的交流,阅读源代码应该是最直接最有效的学习途径。尤其是比较专业 的领域。
要开放源代码,下面几点比较重要: ×、语言要流行。 ×、语言的函数和类库统一。 ×、语言的语法和编译器要统一。 ×、编译器是否开 放源代码。 ×、API是否开放源代码。 ×、语言的可重用性、功能、友好性。
语言统一的必要性:如果大家都用一种编程语言,都用同样的函数,同样的类库,那么,大家的共同语言就会很多。大家只要学会一种语言, 一套函数,一套类库,就可以相互读懂源代码,这样,学习量是最少的。学习新的API浪费程序员大量的时间和精力,尤其是当这个API有大量 和其他API重复的功能的时候。
要增加代码的可重用性,要从下面几点着手: ×、代码的可读性。如格式、是否接近英语语法和单词。 ×、代码的表达能力,也就是简单性 ,能用最少的语句和单词实现同样的功能。 ×、代码的结构性,如函数、模块、glibc源码分析类。
语言功能的强大从下面几点来说: ×、是否拥有大量的库支持。这是最重要的,要求编写任何功能的程序都有强大的库支持。 ×、语法功能 是否强大,比如是否有出错处理。是否有指针。
语言的友好性: ×、语言包的大小,语言包越小,学习越简单。 ×、语言是否有友好的编辑调试环境。 ×、语言的可视化和集成编程环境。
c语言:
从性能上说,除了汇编语言,c语言是最接近机器的语言。各种操作系统的编程接口的默认语言都是c语言。因此,用c语言编程,可以最大限 度发挥操作系统的能力。同时,由于绝大部分的商品软件都是c实现的,都有c编程接口,可以说,没有c不能实现的功能。
在linux环境中,c具有很好的开放源代码的条件,它有统一的编译器gcc,有强大但比较难掌握的编程环境emacs,有统一的API:posix和 linux接口。并且编译器和API是开放源代码的。
在linux上编写图形界面程序,有两个选择KDE和gnome,KDE更成熟,gnome支持多语言和面向对象的程序间的协同。
在windows环境中,现在统一到了vc上,但有一个缺点,windows的升级换代太快,从dos环境到windows
,从windows到windows,到windows,到.net。API常常变换,这样,在windows上的程序代码的寿命会比较短。并且vc的编译器和API 太复杂,难于掌握。
同时,由于c具有现代语言的大量特征,现在常常代替pasical作为教学的编程语言。
实际上,如果不深入学习,c也是一种很简单的语言。不学basic,直接学c完全没有问题。
和其他语言相比,c有多种编译器,多种操作系统API,多种语法和函数。学习的难度大,统一性差。
和java相比,c的语法不够丰富、现代。
java:
相对c,java作为现代语言,具有非常丰富的语法特征,如模块和类,不像c随操作系统和编译器的不同有极大差异,java是一个公司的产品 ,具有唯一的API,因此,java程序员没有语言隔阂。
相对跨平台的语言来说,java具有最好的图形界面编程API。
java所有的API都是类库,相对c的函数来说,是非常大的进步。java具有现代语言几乎所有的特征。
perl:
perl的最大特点是有强大的字符串模式匹配,是最好的文本文件的读取和生成语言。
perl具有很大的自由性,象英语一样有很大的随意性,
perl有一个强大的数据库接口和其他各种接口。
perl有最大量的程序库。
perl不适合编写大程序。
perl有一个著名的缺点是难懂,也有一个著名的优点是简练。
php:
我感到php是个怪胎,本来perl加嵌入html的功能就完全能实现php的功能,还要另创一种语言,加重了大家的学习负担。
php可以嵌入html,更容易编写服务器端程序。
php天然和web服务器以及mysql数据库相结合。魔兽改建 源码
php可以动态生成图像。
python:
首先,python是和basic一样面向初学者的语言,和英语一样容易懂。
python具有和java一样的最丰富的语法。
python有和perl类似的简单性,但没有模式匹配。
python适合编写大程序。
python有和lisp相似的地方,它有将字符串作为程序执行的eval函数,可以对一个对象的所有数据进行保存,可以把函数作为参数传给另一 个函数。
python具有非常好的扩充性,python程序可以和c程序,以及java程序很好地结合。
tcl:
tcl具有最简单的语法,最好的和其他程序交互的能力,有编写图形界面程序的tk。
javascript:
编写动态网页的最佳工具。
lisp:
lisp的语法非常简单,只有简单的函数和参数的语句结构。
lisp数据和程序的界限模糊。
lisp可以深度嵌套。
prolog:
prolog是一种专门的语言。专门用来处理知识。
我感觉prolog是一种数据库的处理工具。
也是根据一些知识衍生出更多知识的推理工具。
basic:
现在最著名的basic是vb,
basic是简单的初级语言。
vb是快速的界面生成语言,是快速的数据库程序开发语言。
vba是vb的应用版,嵌入在offic中。编写offic上的程序很好用。
vbscript是vb的脚本语言,可以产生服务器端和客户端的动态网页。
basic的丑陋在于参数还是默认传地址。太危险。
delphi:
和vb一样是快速开发环境,但性能更好,功能更强大。
.net:
支持多种语言的统一的API类库,
可以编写webform程序,即所有的逻辑都在服务器端,传到客户端的是标准的html3.0,可以被各种浏览器支持。各程序组件间通过soap交换 消息。
--新增内容:
除了汇编语言外,c是最接近系统底层的语言,因此它是大部分程序的编程语言。c的缺点是没有统一的函数库,标准不统一,因此,同样是c程 序员,相互看不懂代码是很平常的事。
ada的出现就是为了解决统一标准的问题。有一个国际组织专门进行严格ada语言的认证来保证ada的统一。因此,ada编译器有很多种,但ada语 言程序用任何ada编译器编译都能通过。同时,ada的执行程序的效率和c比较接近。有人说比c要快,我想不可能,除非c用的库有问题。ada比c 排错能力更强,但c也有类似的功能。ada还有一个缺点,就是语言罗索,象cobol一样非常难看。
java是对c的大大的改进。有统一的标准,丰富的库,完全的面向对象。也继承了c的一些特点,无所不包的全功能,深入系统底层的编程的灵 活性。但因为java学习了c的深入系统底层的特点,它的语言就严格、呆板、罗索。另外,java要跨平台,它的速度就非常令人不满意,只能局 限在高级应用方面。在速度上,可以选择微软的.net和苹果的coco(可能拼写有错误)。他们也同样是底层的面向对象语言。
作为高级的应用程序,如果没有保密要求,脚本语言是最合适的。脚本语言因为不用编译,因此开发速度会比编译语言快很多。
basic和perl都是古老的脚本语言。basic被微软发扬光大了,但它的缺点是没有完整的面向对象特性,因此编写大型程序很困难。另外,微软 的产品肯定是“肿件”。perl被特别设计来进行文本的羽化功能 源码处理,文本处理能力非常强,但不适合编写大程序,语言风格也比较令人费解。
python定位于入门的编程语言,是basic的代替品,它具有和basic同样的简单性,并且编程语句更优雅。python有比较完整的面向对象特性, 可以用来编写大程序,因此有些大型的实用程序是python完成的,从加快开发速度的角度,可以代替c和java。python的另一个巨大的应用领域 是用来操作定制其他程序,这个能力basic也有,从这个角度说,python就是unix世界的basic。但python更进一步,和c的沟通能力非常好,任 何为c编写的接口能够很容易转化为python的接口。和java的接口有专门的python的java版,就是jython,jython可以和java本身一样使用各种 java资源。
ruby首先是smalltalk的替代品。有彻底的面向对象特性。另外,也努力作为perl、php、basic、python的替代品。
rebol是lisp的替代品,同时作为脚本语言的一员,有自己的独特之处,他的网络编程和图形用户界面编程是最强大的。
语言解析语言yacc、 html、xml、xlt、xul等也可以算作语言。
[edit]
各种语言的选择
如果编写对性能要求苛刻,或和操作系统结合紧密的程序,必然选择c。
如果编写到处可用的程序,选java。
如果编写大程序,可能的化尽量用python,不行了再用java和c。因为python带来了生产力。
编写文本的处理程序用perl。
编写知识的处理程序用prolog。
编写最灵活,最模糊的程序用lisp。
编写office程序用vba。
编写服务器端程序,php、perl、python、asp都是选择。
编写数据库程序用vb或delphi。
[edit]
各种语言的选择
如果要追求性能和程序的能力,要完全发挥操作系统的能力,使用c语言是合适的。在windows环境下用vc,在linux环境下用gcc。
如果不是追求和操作系统完美结合,而只是性能,又要追求跨平台性,那么仍然选择c,但可以选择跨平台的库,如qt、gtk、fox、wxwindows 。如果要编写游戏也有跨平台选择:SDL。
如果不满意c领域标准的不统一,不满意c的容易出错,不满意c的面向对象特征不彻底。如果不在乎跨平台,windows平台可以选择c#,mac平台 可以选择coco。如果需要跨平台,可以选择java。
如果需要跨平台,又要广泛的支持的话,选择java。
如果不在乎商业机密,应用目标也不是太苛刻的话,编写大型跨平台程序还有一个选择就是python或ruby。脚本语言,但是具有全面的库的支 持,有和c语言的方便的交互能力。他们和java相比,编程效率更高。同时因为没有编译,程序更方便修改。因为他们的库都是c实现的,也比 java有更高性能。同时,他们都是开源的,都是对商业应用友好的,也是简单的、方便定制的。也是不满意java的不可控制的越来越庞大的库 的又一个选择。
在linux下,最方便的工具语言是perl,它有强大的社区和代码库的支持。
如果只作为简单应用的工具语言,python和ruby是更好的选择,他们的跨平台移植性好,应用也比较广泛。其中python更适合入门和交流,长 期使用也不错。ruby是对python不满意的另一个选择,它提供了很多额外的功能。
如果要选择一个程序的嵌入语言,原来有lisp、basic和java,现在还可以选择python和ruby。
如果在要求动态解释执行语言,而又不想学其他语言的话,c程序员的选择是pike,java程序员的选择是beanshell。
在java平台,又想用脚本语言的话,可以用jython。
最正统的基于文档的语言或叫动态页面语言是javascript。
最专门的服务器端语言是php,当然也有很多其他选择。
xml语言以xul为最著名,dtml也算一个,你自己也可以用xml作为自己特殊用途的语言。比如jedit就用xml作为一种模式定制语言。xml语言是 一种比较先进的趋势,比现有的语言在特殊领域更高效。
要找容易实现的语言,lisp和tcl是选择。
lisp的数据和程序融为一体的能力和自由是其他语言都没有的。现在出现了一个lisp的现代化的变种:rebol。
如果有基于事实的编程的需要的话,prolog和clips是必然。
[edit]
我为什么选择了python
首先声明,我编程只编应用程序,就是代替自己工作的小程序。如果编写系统程序总会用到c或java的。
我喜欢脚本语言,脚本语言不用编译就可以运行,非常便于修改,而编程序是一种经常性的活动,程序编完后总在不断的修改中,没必要搞的 很隆重,还要编译。另外,脚本程序每个使用的人都可以随手拿来修改,不会出现还要去找源代码的情况。因此,c和java就被排除了。
我喜欢简单的语言,不喜欢为了编写简单的程序而去学习大量复杂的规定,需要大量的学习才会的语言不是好语言,是把人当机器看。c和java 都有严格但罗索的语法,有永远学不完的函数、类、库。让人看到就头大。而perl有各种怪里怪气的速记符号,程序常常让人头晕。简单的含 义除了容易学,还要功能丰富,常用到的东西要早就准备好,不用每个人都去写同样的数据结构程序等。python有丰富的数据类型,有完备的 面向对象的结构,有规则表达式等各种方便编程的模块。这个逻辑就是程序做的多,人做的就少,如果程序做的少,就要人做的多。这就是界 面友好的问题。容易上手,功能丰富是程序设计的很重要的目标,windows就是靠这个流行的。而python也很好的体现了这点。而perl象unix的 emac之类其它工具一样,功能强大,但太难学,太难懂。是比较违背人性的。
关于性能。现在cpu已经很强大了。除了很大的程序和系统程序,没必要关心性能。
关于功能。如果不是编写系统程序和贴近系统的程序,没必要使用操作系统特别提供的功能。c是可以干任何事情,但它编程效率低,复杂。
至于我为什么不用vb,因为vb太庞大了。我没必要实现一个小功能启动这么庞大的程序。太夸张。另外,vb没有类继承,虽然是应用编程,但 如果要编稍微大的程序,总会用到类继承的。
python得强大得扩展能力使对python得学习不会浪费。python经过简单得处理能使用各种得c和c++库,也可以被c和c++调用。python可以直接 使用java得类,也可以直接被java调用。这样,对python、java、c得学习和使用经验都不会被浪费,还能相互补充。python可以提高java和c 得编程效率,java和c可以补充python功能上得不足。python还可以和tcl直接交互,这种功能是内置得。期待python能简单的调用perl和php得 功能。能使用lisp和prolog更好。
[edit]
ruby 吸取了所有语言精华的语言 第二版
ruby 语言还是杂耍 ruby?:O ruby 日本人的玩意
ruby有
* perl的正则表达式
* python的语言的简单性可读性、最容易的扩展能力,强大的可移植性。
* php的嵌入功能和多种客户端
* smalltalk的纯面向对象语法和单继承
* lisp的无穷嵌套的语法,也就是函数式的语法。
* 用“块”来实现更快捷的数据结构的处理。不知道是不是scheme的宏功能。用块能更清楚的实现python的表处理功能。
* java和ada的线程编程
* java的安全编程
不得不承认ruby确实是个精彩的语言,它完全学会了lisp的所有编程都是函数的思想,smalltalk的所有东西都是对象的思想,perl的一个目的 多种手段的方法,python的简单化的“最少惊喜”的原则,java的多线程和安全控制的功能,tcl的容易扩展的功能,php的嵌入功能和强大客 户端的功能,最方便的shell命令的调用。
[edit]
ruby和python的比较
[edit]
python和ruby的相同点
* 都强调语法简单,都具有更一般的表达方式。python是缩进,ruby是类basic的表达。都大量减少了符号。
* 都是动态数据类型。都是有丰富的数据结构。
* 都具有c语言扩展能力,都具有可移植性,比perl的可移植性更好。也都可以作为嵌入语言。
* 都是面向对象的语言,都可以作为大项目的开发工具。
* 都有丰富的库支持。
* 也有最宽松的版权许可,除了一些工具属于GNU世界。
* 都有lisp特色的eval函数,也都能把函数作为参数。
* 也有图形界面的ruby的专门编辑器。
* 都获得了广泛的c库的支持。如qt、gtk、tk、SDL、FOX等,ruby计划实现SWIG接口。
* 都有完善的文档。
[edit]
和python相比ruby的优点
* 具有正则表达式和嵌入html的功能。python也有正则表达式,但没有ruby的应用方便和广泛。python的嵌入html项目才刚起步。ruby还有 apache的mod模块。ruby本身也实现和很多unix工具,如racc,doctools。比python更亲近linux。
* 比python功能更完整的面向对象的语法。
* ruby的整个库都是具有类继承的结构。
* 他的基本的数据类型和运算符都是可以重载的。
* ruby主要的功能都是通过对象的方法调用来实现的,而不是函数。python也在向这方面发展,但没有ruby做的彻底。
* ruby的类是更规范的单继承,还有接口等概念的实现。
* python可以实现在列表内的条件语句、循环语句,而ruby用“块”的方式来实现这个功能,比python的更灵活,更具有通用性。
* ruby具有类似lisp的彻底的函数方式的条件语句、循环语句等。语句的表达能力更强。
* 附带一些unix工具,如racc等。
[edit]
和python相比ruby的不足
* 最大的不足正是因为ruby的强大所引起的。它没有python的简单性好。比较复杂的面向对象语法、“块”语法的引入、正则表达式的引入、 一些简写标记都增加了语言的复杂性。
* python的缩进表达方式比ruby的basic的表达方式更让人悦目,ruby程序的满眼的end让人不舒服。当然,ruby认为end的方式比python更先 进。
* ruby还没有python的“自省”的能力,没有从程序文件中生成文档的能力。
* ruby没有国际化的支持。国际化支持在ruby的计划中。这是因为ruby的历史比python要短造成的。
* ruby没有类似jython的东西。
[edit]
python和ruby的语言的选择
从简单的就是好的来说,选python是没错的。python适合寻找简单语言的人,这很可能造成python更流行,因此也有更多的支持。但如果要追 求更强大的语法功能,则ruby是好的选择。因为ruby和python的哲学有很多相似的地方,先从python入手,尽量用python,如果python的能力 不足了,可以在找ruby。
ruby和python的比较,就像五笔和拼音输入法的比较。拼音作为入门的输入法和长久使用的输入法都没有问题。五笔适合更高要求的情况。如 果追求性能的不妨学学ruby。对编程语言感兴趣,想了解各种编程概念的学ruby也会很兴奋。
[edit]
php有什么好处
我一直认为php是一个垃圾,因为它只是实现了脚本语言得嵌入,却单独实现一种语言、实现大量得函数库,浪费了大量得开发人员得宝贵时间 来重复其他脚本已经实现了得功能,也浪费了php开发人员得大量学习时间,还要单独学一种只能存在于web服务器得语言,浪费了perl、 python得已有得使用经验。相似得还有pike,一种c得脚本语言,没什么新东西,还不如仍然用c编译器。
但我最近看书才了解php得独特得开发目标。
php为什么不直接用perl作脚本语言。是因为perl是一种unix语言,带有unix传统得字符神秘高深,让人难于学习。而编动态网页得人不见得会 用perl这种unix工具,他们可能只有html知识。php就简化了perl得语言,变成了一种简单友好得语言,免去了人们学习perl得困难。
php为什么不选python作脚本。因为python是一种面向对象得语言,大量得功能都要涉及面向对象概念,而web应用只是简单得实现客户机逻辑 和显示功能。没必要涉及面向对象得复杂概念。函数是最简单,最容易理解得,因此,php倾向于所有得功能都用函数来解决,而不是用对象来 解决。这有点象c和c++之争。应该承认,函数在实现简单功能得时候是最有利得工具,它得语句量最少。
php定位于以html为用户界面,充当各种服务器得客户端,实现得是传统得客户端编程得任务。它有pop、smtp、ftp、多种数据库等各种服务器 得客户端得函数,也有、pdf生成,xml处理等这种必要得功能。这些都是其他脚本比不上php得地方。
我几乎没用过php,说得不对,请指教。
[edit]
ada语言草述
ada语言我看了他的介绍。
ada语言和c一样是一种编译语言,他们最后编译出的执行文件的机器码都很小。因此现在众多的语言只有c很ada能比较。
和c相比,ada的特点是可靠、可移植。
他的可靠是通过比其他语言都强大的类型,每种类型还都可以象数据库字段一样进行强类型、范围的检查。以此来保证在编译中就发现错误。
它有强大的标准化组织,严格认证ada编译器的标准。有多线程能力。
适于编写实时程序。
但和c相比太复杂、罗嗦,因此注定不能流行。
[edit]
多脚本语言的大统一及疑问
现在各种脚本语言太多了,有必要进行整合,parrot是一个好的想法。.net也是好的想法。它为各种脚本提供了一个统一的虚机,为各种脚本 语言提供了基于“类”的相互调用,为各种脚本提供了统一的类库。
现在各种脚本语言只是提供了对c语言的交互性,这种交互也是费劲的和效果不好的。比如python、perl、ruby等都提供了对c的交互功能。脚 本语言之间的交流障碍重重。而类似.net的东西,提供了非常容易的各种脚本的相互利用的途径,避免了很多的代码的重复编写。这种标准平 台的力量是很大的,这种标准平台为什么没有在开源领域首先出现呢?众多的脚本正是开源的特点和优势,为什么这种问题要微软来解决呢? 前面有人提出了类似的问题,在linux中为什么至今没有好用的类似ODBC的东西呢?
可能这种整合只有商业公司有能力实现吧。
我的理解是,如果有创新思想的人都拿他的想法去卖钱了,因此,在开源中只剩下了模仿的人。kde是模仿windows,koffice是模仿office, linux是模仿unix,gcc、bash等也全都是模仿,以及gstep等,还有freedos、atheos等也是模仿,wxwindows、SDL也是模仿。我想知道开源社 区有没有自己的创新?我所知道的创新是zope,但zope最初也是商业产品,后来才开源的。perl是创新,python是创新,但还有什么呢?是不 是开源领域只有hack,没有creator?
[edit]
.net介绍
.net所实现的java的功能
可控代码 跨平台的虚机和伪码免费赠送命令行编译器 纯面向对象语言 对xml和xml web services的支持 和jsp对应的asp.net 网页上的程序 一套统一的中间件环境。
asp.net跟jsp不是同一个层次上的web技术, asp.net使用完善的事件响应机制,WinForms类似的 WebForm技术,只有JSF跟Asp.net有可比性。
.net未实现的java功能
免费的集成开发环境 多厂家支持,跨平台的成熟度
免费的IDE, #develop , ASP.net的有MS的WebMatrix 而免费开源的CLR实现,有MS自己的XP,FreeBSD,MacOS下的实现(原理演示不能进行商 业应用), Novell下的Mono项目,已经发布了Beta1版本,在-6- 将会发布Release1; 还有GNU的一个.net实现!!
[edit]
.net实现的java不具备的功能
多语言支持 强大的集成开发环境。在windows上媲美本机程序的速度。 对COM的支持,对vs的继承 对widows form 、web form、服务器端程序 的图形直观编程。
[edit]
相对vs6的改进
统一了集成开发环境,使c++程序也具有了vb的友好性。
[edit]
xml各种技术介绍
xml:
xml是统一格式的结构化数据的文本文件。
基于xml的程序,数据结构是开放的,方便不同程序处理同一种文件,这样,程序之间可以达到高水平的协作。
xml现在成为了各行各业统一数据格式的基础。
xml发展出了完善的语法,它用DTD或scheme来界定xml的标记语言。用uri来唯一确定一个xml格式。用css或XLT来转换xml格式,xlink和 xpointer等来建立xml的链接,用xpath来定位xml中的数据。
xhtml:
是严格符合xml格式的html。
RDF:
基于xml的元数据描述语言。方便交换结构化数据。方便交换知识。
RDF是用主语、谓语、宾语来描述知识的。
SVG:
xml格式的矢量图形格式。
SMILE:
xml格式的各种多媒体在时间线上的协同。
xmath:
xml格式的公式描述语言。
xml-rpc和soap:
以scape的mazilla使用的程序界面语言,基于xml格式,比html强大的多的描述图形界面的xml语言。它用css来换肤,用DTD来实现多语言界 面,用javascript来实现程序逻辑,以此编写跨平台的可方便定制界面的程序,现在这个程序API功能已经很强大了,整个mazilla程序就是基 于xul的。
xaml:
MS在LongHorn平台的最新编程语言,将统一Windows与Web编程,直接使用
LongHorn下的浏览器进行执行, 跟XUL有类比性
[edit]
最先进的xml格式图形界面程序开发工具-xul
大家知道netscape程序,一个仅次于ie得浏览器,也有很多人知道mozilla,netscape得开放源代码版本。但很多人只是使用mozilla,不知道 mozilla另一个重要得功能--程序开发。在netscape开放源代码后三年mozilla得1。0版还没有问世,很多人讥笑他的超慢得开发速度,实际 上,mozilla酝酿出了一个超酷得新产品,可以看作是软件开发工具发展得另一个里程碑。
现在基于浏览器得三层开发结构非常流行,微软得.net得思路就是基于这个结构得。另外,不考虑服务器结构,就是基于网页得javascript小 程序也对人很有吸引力,这些产品得思路都是以html为用户界面,但开发人员常常苦恼于html太简陋。而mazilla得xul解决了这个问题。
xul是对html得扩展
coco编程是什么意思?
COCO是指“Code Conversion Utility”,也就是代码转换工具,它是一个开放源代码的平台,具有良好的可扩展性。使用COCO,可以将不同语言之间的代码进行转换,例如C, C++, Java等等,同时还能生成可视化的文档。这个工具主要面向企业级编程人员,在软件开发、测试和维护等方面起到重要的辅助作用。
COCO还支持面向对象程序设计(OOP),并提供一套完整的库支持,包括数据处理、容器、图形界面、网络和多媒体等。OOP是一种面向对象的程序设计思想,将现实中的事物抽象成对象,而对象又组成了类,从而实现数据抽象、继承和封装等特性。COCO通过OOP实现了模块化、重用性和可维护性,让程序员更加高效地开发软件项目。
COCO的出现,大大简化了企业级软件开发的工作,帮助程序员提高了工作效率。它适用于各种编程语言之间的转换,既可以在Windows平台上使用,也可以在Linux等其他平台上使用。当然对于初学者来说,COCO还是有一定的上手难度,需要花费一定时间和精力去学习和掌握。但只要掌握了它的原理和使用方法,就可以大大提升编程的效率和质量。
mmdetection框架和工程实践
MMDetection框架详解与工程实践
1. 引入与安装
MMDetection是一个模块化的目标检测框架,通过组合不同组件构建自定义模型,支持多种算法和模型,具有高效和性能优势。它基于COCO 目标检测竞赛冠军团队的代码库,适用于Linux系统,Windows支持有限。
2. 框架结构与设计
框架采用模块化编程,便于重复使用和模块化搭建。__init__.py文件的使用和管理,如定义__all__属性,有助于代码复用和维护。设计模式如构造者模式和注册器模式,分别用于分离构建过程和简化对象创建过程,实现代码扩展性。
3. 配置与模型构建
配置文件详细描述了模型的参数设置,如Cascade RCNN的RPN和Fast R-CNN结构。mmdetection将模型细分为多个模块,如Backbone、Neck等,每个模块负责特定任务。配置文件的分析显示,不同IOU阈值在训练和推理阶段可能导致性能不匹配,Cascade RCNN通过多阶段结构解决此问题。
4. 推理与训练源码解析
测试代码如test.py展示了单GPU和多GPU测试过程,以及如何通过配置文件和模型进行检测。训练代码train.py则涉及模型构建、数据集注册和训练步骤。自定义数据集的构建包括数据读取、图像增强和COCO/VOC格式转换。
5. 实践技巧
如使用Kmeans聚类优化边界框,热力图绘制用于特征可视化,以及利用Visdom和Hook进行训练过程可视化。工程应用方面,C++与Python和TorchScript的交互提供了一种灵活的插件解决方案。
总结:
MMDetection框架通过模块化设计、丰富的算法支持和高效的执行,为用户提供了强大的目标检测工具。框架结构、配置管理和源码解析展示了如何构建、调整和优化模型。实践技巧部分提供了与C++交互和模型优化的实用方法,方便开发者在实际工程中灵活应用。