由于工作需要用到地址五级联动,爬取了国家统计局的行政区划代码2019年的数据(暂时最新就是2019年的),包含省、市、县/区、街道/镇、社区/村,精确至社区/村。
SqlServer数据库导出csv文件,逗号分隔符,总计648442条数据。
导出文件字段说明:code:行政区划编码;
name:行政区划名称;
sort:城乡分类代码。
五级事例:11 北京市1101 市辖区110101 东城区110101001 东华门街道110101001001 多福巷社区居委会数据来源网址:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/index.html
2026/1/18 11:57:33 19MB 行政区划
1
最近一周比较忙,主要的工作内容是在做一个叫“键盘精灵”的东西,简单来讲就是将很多数据放到内存中,对这些数据进行快速检索,然后找出根据输入条件最匹配的10条记录并予以展示。
具体和下面两款炒股软件的相关功能类似:数据以文本形式存在文件中,且数据量较大,有近20万条,每一条记录有几个字段,以分隔符分割。
当时使用的是6万条记录的测试数据,文本文件将近10M,这个模块加载到内存并建立缓存之后,大概会占用将近70-80M的内存。
自我接手以后,主要的任务就是降低内存消耗和提高匹配效率。
拿到代码后,第一步就是看设计文档,然后断点一步一步的看代码,大概明白了逻辑之后,发现思路有一些问题。
之前的代码处理流程思路大
1
用python写的一个json转csv文件的脚本,csv文件的分隔符用的'|',hardcode到代码里了。
使用方法:1.直接执行pythonjson2csv.py(待转换文件hardcode到代码里)2.转换完后先打开excel,然后从excel里面找到转换后文件.csv打开(注意不能直接打开否则会有乱码)
2025/12/8 10:20:30 1KB python json csv
1
C语言词法分析器#include#include#includechar*key0[]={"","auto","break","case","char","const","continue","default","do","double","else","enum","extern","float","for","goto","if","int","long","register","return","short","signed","sizeof","static","struct","switch","typedef","_Complex","_Imaginary","union","unsigned","void","volatile","while"};/*保留字表*/char*key1[]={"","(",")","[","]","{","}",",",";","'"};/*分隔符表*/char*key2[]={"","+","-","*","/","%","","==",">=","","~","|","^","&","=","?:","->","++","--",".","+=","-=","*=","/="};/*运算符表*/intxx0[35],xx1[10],xx2[31];.......
2025/11/25 7:08:42 19KB C语言词法分析器
1
自动批量把csv格式的文件为xls格式的文件经常我们需要转换的话,用到数据再进行分隔符进行转换成XLS,要是文件多的话就很慢由于我司需要与TCL打交道,经常从上面导出文档为CSV格式,特此开发了个小工具。
2025/9/20 0:39:47 335KB csv格式 转换 xls格式
1
向您SQLServer提供所有缺少的部分,例如正则表达式和动态算术字符串评估。
--SELECT3SELECTSQLNET::New('x+y').ValueInt('x',1).ValueInt('y',2).EvalInt()asResult查找您的解决方案:动态算术表达式动态数据透视表正则表达式字符串插值用DirectoryInfo和FileInfo替换xp_cmdshell性能与可扩展性性能调整是DBA最重要的任务之一。
不要错过通过用户定义函数(UDF)和表值函数(TVF)将简单表达式的查询性能显着提高300%,将复杂代码的查询性能显着提高2000%以上的机会。
在SQL中使用分隔符分割字符串的基准方法1,000行10,000行100,000行1,000,000行Eval-SQL.NET4毫秒13毫秒160毫秒1,650毫秒fn_split(TVF)100毫秒625毫秒5,500毫秒55,000毫秒下载*本月解锁的PRO版本最低要求:SQL2012/SQ
2025/7/21 1:51:37 520KB sql sql-server evaluation regular-expression
1
共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题,保存于en-zh.csv,分隔符是制表符\t(不是默认逗号)。
句粒度,但有不少长句,裁剪后5w对也够用。
原始数据集也在包中,其中en-zh_News.tmx有一部分句子有问题,(en-zh.csv丢弃了有问题的句子),如果必要建议不要直接使用该文件。
另外附赠我对语料的预处理文件(propressor.py),以及数据集(pytorch的Dataset)等相关的实现(LangData.py)。
如果又可以改善的地方,欢迎留言
2025/7/16 16:52:35 35.14MB 中英平行语料库 语料
1

ASP(Active Server Pages)是一种微软开发的服务器端脚本语言,常用于构建动态网页。
这个“asp常用函数.rar”压缩包包含了一些在ASP编程中常用的函数,这些函数可以帮助开发者更高效地处理字符串、数字和数据转换,从而提高开发效率。
1. **字符串处理函数** - `Len()`:返回字符串的长度,这对于确定字符串内容和处理字符串截取非常有用。
- `Left()`:从字符串的左侧提取指定数量的字符。
- `Right()`:从字符串的右侧提取指定数量的字符。
- `Mid()`:从字符串中间提取指定长度的子串。
- `Trim()`:删除字符串首尾的空格。
- `LTrim()`:删除字符串左侧的空格。
- `RTrim()`:删除字符串右侧的空格。
- `StrConv()`:进行字符串转换,如大小写转换、货币格式化等。
2. **数字处理函数** - `Int()`:将数字向下取整为最接近的整数。
- `Round()`:四舍五入到指定的小数位数。
- `FormatNumber()`:格式化数字,例如添加千位分隔符或控制小数位数。
3. **转换函数** - `CStr()`:将其他类型的数据转换为字符串。
- `CInt()`:将字符串或其他类型的数据转换为整数。
- `CDbl()`:将字符串或其他类型的数据转换为双精度浮点数。
- `CDate()`:将字符串转换为日期时间类型。
- `CLng()`:将字符串或其他类型的数据转换为长整型。
4. **其他常见函数** - `Request()`:获取HTTP请求中的数据,如表单变量、查询字符串等。
- `Response()`:发送HTTP响应,可以用来输出HTML、设置HTTP头等。
- `Server.URLEncode()`:对URL中的特殊字符进行编码,防止URL解析问题。
- `Session()`:处理用户会话状态,存储和检索用户的特定信息。
- `Application()`:在所有用户间共享数据,适用于全局变量。
这些函数是ASP编程的基础,了解并熟练掌握它们对于编写高效、可维护的ASP代码至关重要。
通过"asp常用函数.htm"文档,你可以深入学习每个函数的用法、参数和返回值,以便在实际项目中灵活应用。
记住,理解和实践这些函数是提升ASP编程技能的关键步骤。
2025/6/19 18:22:46 9KB
1

### QT添加外部库lib的方法详解#### 一、前言在使用QT开发过程中,经常需要引入第三方库来实现特定功能或提升开发效率。
本文将详细介绍如何在QT项目中添加并使用外部静态库(lib)的方法。
#### 二、准备工作在开始之前,请确保您已经具备以下条件:1. **安装了QT环境**:包括QT Creator和相应的编译工具链。
2. **已有的QT项目**:如果您还没有项目,可以通过QT Creator新建一个项目。
3. **需要添加的外部库文件**: - 静态库文件(.lib或.a)。
- 相应的头文件(.h)。
#### 三、添加外部库的基本步骤1. **放置库文件**: - 将所需的静态库文件和头文件放置到项目的适当位置。
通常的做法是在项目根目录下创建一个专门的文件夹(例如“API”),并将这些文件放入该文件夹中。
2. **添加头文件**: - 在QT Creator中,右键点击项目名称 -> “添加现有文件” -> 选择所需的头文件 -> 点击“确定”。
这样做的目的是告诉编译器去哪里查找这些头文件。
- 如果出现错误提示,可能是因为编译器无法找到相应的库文件或链接配置有误。
此时,可以尝试调整配置或者按照后续步骤操作。
3. **配置.pro文件**: - 打开项目中的.pro文件,在文件末尾添加以下代码来指定库文件的位置以及链接方式: ```pro LIBS += -L/path/to/your/library -lmylibrary INCLUDEPATH += /path/to/your/include ``` 其中,“/path/to/your/library”是库文件所在的绝对路径,“-lmylibrary”是库文件的名字(不含扩展名)。
而“/path/to/your/include”则是头文件所在的路径。
4. **编译项目**: - 保存所有更改后,重新编译项目以确保库文件被正确链接。
5. **调试与测试**: - 编译完成后,运行程序检查是否成功调用了库中的函数。
如果遇到问题,可以查看编译日志或使用调试工具定位问题所在。
#### 四、常见问题及解决方法1. **编译错误**: - 如果在编译过程中遇到关于找不到库文件的错误,确保您已经在.pro文件中正确指定了库文件和头文件的路径。
- 检查库文件的命名是否正确,尤其是对于不同平台(Windows/Linux等)下的库文件命名差异。
2. **链接错误**: - 如果在链接阶段出现问题,可能是因为没有正确地指定库文件的链接选项。
确保在.pro文件中使用了正确的-L和-l参数。
- 另外,注意库文件的版本兼容性问题,特别是当使用跨平台库时。
3. **运行时错误**: - 如果程序在运行时出现问题,可能是因为库文件的依赖关系没有正确处理。
确保所有必要的依赖项都被正确链接。
#### 五、注意事项1. **路径配置**: - 确保所有路径都为绝对路径,并且符合项目的实际结构。
- 在Windows系统下,路径分隔符为反斜杠(\),而在Linux/Unix系统下,则使用正斜杠(/)。
2. **编译器兼容性**: - 确认使用的库文件与编译器版本兼容。
例如,某些库文件可能仅支持特定版本的GCC或MSVC编译器。
3. **动态库与静态库的区别**: - 本文主要介绍了如何添加静态库,但有时也会用到动态库(.dll/.so文件)。
对于动态库的处理方式略有不同,需要在运行时加载或使用特定的加载机制。
#### 六、总结通过上述步骤,您应该能够成功地在QT项目中添加并使用外部静态库。
正确配置和使用外部库可以极大地提高开发效率,减少重复劳动。
在遇到具体问题时,可以参考官方文档或其他社区资源获取更多帮助。
2025/6/18 11:40:47 5.24MB
1
一、实验目的:通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。
并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。
编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。
并依次输出各个单词的内部编码及单词符号自身值。
(遇到错误时可显示“Error”,然后跳过错误部分继续显示)二、实验预习提示1、词法分析器的功能和输出格式词法分析器的功能是输入源程序,输出单词符号。
词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。
本实验中,采用的是按类来安排种别码的方式。
2、部分单词的BNF表示(可参考教材43页的状态转换图)->->|||ε->->|ε->+->-->>->>=3、做词法分析器需要把对象语言的词法全部描述出来,在这我们取C语言子集,它的词法如下:(1)关键字mainifelseintreturnvoidwhile……..所有的关键字都是小写。
(2)专用符号=+-*/<=>>===!=;
:,{}[]()(3)空格和空白、制表符和换行符。
空格一般用来分隔ID、NUM、专用符号和关键字,在词法分析阶段通常被忽略。
各种单词符号的种别码,这是一种符号一个编码的设计。
只供参考!单词符号 种别码 单词符号 种别码main 2 [ 28int 1 ] 29char 3 { 30If 4 } 31else 5 , 32for 6 : 33while 7 ; 34ID 10 > 35NUM 20 = 37+ 22 +”,当前字符为’>’,此时,分析器倒底是将其分析为大于关系运算符还是大于等于关系运算符呢?显然,只有知道下一个字符是什么才能下结论。
于是分析器读入下一个字符’+’,这时可知应将’>’解释为大于运算符。
但此时,超前读了一个字符’+’,所以要回退一个字符,词法分析器才能正常运行。
在分析标识符,无符号整数等时也有类似情况。
5、模块结构见附图三、实验过程和指导:(一)准备:1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。
2.编制好程序。
3.准备好多组测试数据。
(二)上机调试:(三)程序要求:程序输入/输出示例:如源程序为C语言。
输入如下一段:main(){inta,b;a=10; b=a+20;}要求输出如右图。
(2,“main”)(5,“(”)(5,“)”)(5,“{”)(1,“int”)(2,“a”)(5,“,”)(2,“b”)(5,“;”)(2,“a”)(4,“=”)(3,“10”)(5,“;”)(2,“b”)(4,“=”)(2,“a”)(4,“+”)(3,“20”)(5,“;”)(5,“}”)说明:识别保留字:if、int、for、while、do、return、break、continue;
单词种别码为1。
其他的都识别为标识符;
单词种别码为2。
常数为无符号整形数;
单词种别码为3。
运算符包括:+、-、*、/、=、>、=、<=、!=;
单词种别码为4。
分隔符包括:,、;、{、}、(、);
单词种别码为5。
以上为参考,具体可自行增删。
程序思路(参考):这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。
在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。
经过词法分析后,源程序字符串(源程序的外部表示)被翻译
2025/5/25 6:43:53 4KB 词法分析
1
共 46 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡