python如何给文本数据去重?知识图谱三元组数据去重发布于2022年02月25日 python 在构建知识图谱的过程中,在把数据最终写入neo4j数据库之前,苏南大叔生成了一个三元组文本文件。这个文本文件就是由一行一行的普通文本所组成的。那么,在这些数据中,是存在着一些重复数据的,那么问题来了,这些文本数据如... 阅读更多
奇怪的python系列,python如何做数组分割连接?发布于2022年02月24日 python 本文中苏南大叔来吐槽一下奇怪的python语言,其实,最奇怪的当属R语言。不过因为R语言和大家离得太远。所以,这里就先吐槽python语言吧。本文吐槽的地方是:数组截取,以及数组连接成字符串。大家好,这里是苏南大叔... 阅读更多
nginx的lua语言编程,如何编写一个nginx防火墙?发布于2022年02月23日 Nginx nginx实际上支持插件,这些插件其中就可以使用lua语言编写。苏南大叔最近看了一个开源的代码,就是使用lua给nginx增加了个防火墙功能。功能听起来非常强大,看代码的话,其实也并不复杂。大家好,这里是苏南大叔的... 阅读更多
真实黑客案例,thinkcmf日志注入一句话木马发布于2022年02月22日 php 苏南大叔最近接到委托,拯救一台被黑客攻占的网站服务器。经过和黑客之间不断的攻防战役,苏南大叔慢慢稳定下了局面。然后就可以清晰的看到黑客的一条攻击途径。那么,本文中,苏南大叔就这个thinkcmf的漏洞攻击方式说一说... 阅读更多
thinkphp开启debug的同时,如何不对外显示错误信息?发布于2022年02月21日 php 本文还是接着说最近接到的这个老的thinkphp系统的事情啊,这个系统是基于thinkphp@3.2.3的,很古老了不是?所以,也是有一定的风险的。所以,黑客兄弟也是盯着这个系统一直在鼓捣。大家好,这里是苏南大叔的... 阅读更多