news 2026/5/26 1:55:15

6、命令行工具创建与数据清洗全解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
6、命令行工具创建与数据清洗全解析

命令行工具创建与数据清洗全解析

1. 创建可复用的命令行工具

1.1 执行脚本

若你处于可执行文件所在的目录,需按如下方式执行(注意./):

$ cd ~/book/ch04 $ ./top-words-2.sh

若尝试执行没有正确访问权限的文件,会看到如下错误信息:

$ ./top-words-1.sh bash: ./top-words-1.sh: Permission denied

1.2 定义 Shebang

尽管我们已能独立执行文件,但应在文件中添加所谓的 Shebang。Shebang 是脚本中的特殊行,用于指示系统使用哪个可执行文件来解释命令。在我们的例子中,希望使用bash解释命令。以下是添加了 Shebang 的top-words-3.sh文件示例:

#!/usr/bin/env bash curl -s http://www.gutenberg.org/cache/epub/76/pg76.txt | tr '[:upper:]' '[:lower:]' | grep -oE '\w+' | sort | uniq -c | sort -nr | head -n 10

Shebang 这个名称源于该行的前两个字

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 5:35:50

9、数据工作流管理与探索指南

数据工作流管理与探索指南 1. 数据工作流管理 1.1 工作流基础 在数据处理中,有时一个步骤可能会花费很长时间,或者你希望继续使用相同的数据,又或者数据来自有速率限制的 API。这时,让一个步骤将数据保存到文件,后续步骤对该文件进行操作是个不错的选择,这样可以避免冗…

作者头像 李华
网站建设 2026/5/25 6:22:43

12、分布式处理与数据建模实战

分布式处理与数据建模实战 1. 分布式处理基础 在分布式处理中,我们可以通过不同方式利用远程机器来完成任务,主要包括在远程机器上运行普通命令、直接在远程机器间分发本地数据以及将文件发送到远程机器进行处理并取回结果。 1.1 获取运行中的 AWS EC2 实例列表 若使用 A…

作者头像 李华
网站建设 2026/5/26 5:47:11

Python爬取ZLibrary元数据实战

技术文章大纲:用Python抓取ZLibrary元数据 概述 简要介绍ZLibrary及其元数据的价值,包括书名、作者、ISBN、出版日期等信息。说明Python在数据抓取中的优势,如高效、灵活和丰富的库支持。 准备工作 列出必要的工具和库: Pyth…

作者头像 李华
网站建设 2026/5/24 22:29:17

pyOCD又升级了,发布V0.42版本,月更(2025-12-18)

https://github.com/pyocd/pyOCD/releases 新功能 运行子命令: 1、引入新的运行子命令,支持按时间限制或直至文件结束符运行目标(适用于CI/CD工作流) 2、支持半主机控制台输出/输入及SWV输出 改进 标准I/O: 1、新增抽…

作者头像 李华
网站建设 2026/5/24 20:50:01

从 “视而不见” 到 “闻声而动”,杭亚 YS - 01 改写车间安全史

杭亚 YS-01 工业语音声光报警器工厂车间应用案例 一、工厂车间安全警报现状与痛点 在工业生产场景中,工厂车间面临着诸多安全风险,而传统报警设备在应对这些风险时,暴露出一系列问题。 报警效果欠佳:部分车间环境嘈杂&#xff…

作者头像 李华
网站建设 2026/5/24 14:33:50

震惊!百度地图入驻商户好用的服务商排名新鲜出炉!

震惊!百度地图入驻商户好用的服务商排名新鲜出炉!在当今数字化时代,百度地图入驻商户已成为众多商家拓展业务、提升曝光的重要途径。而选择一家靠谱的服务商能让这一过程更加高效、顺利。近期,一份关于百度地图入驻商户好用的服务…

作者头像 李华