Python和nebula结合的开源项目

wey · 2023 年2 月 13 日 08:01

Spark 单独安装，不过要能访问到 nebulagraph 的 graph, meta, storage 服务。

Nebula-algorithm 就是要保证 jar 包被提交、执行的时候被 pyspark 引用到

cuihangrui · 2023 年2 月 14 日 08:44

请问在服务器下执行你的一键安装命令（

）
拉取卡住了是怪网络问题吗?

wey · 2023 年2 月 14 日 08:46

这个过程是会拉取 docker 镜像，还会拉取一个数据集（live journal）和 nebula algorithm 的 jar 包，一次要个几个 GiB 的下载量哈，跑多久了？

wey · 2023 年2 月 14 日 08:46

另外，我昨天更新了 nebula-up 你这么执行之后，会自动给你启动一个 jupyter notebook，里边一切都准备好了，里边有一个 pagerank 的 notebook 可以打开按行执行哈

notebook 就是你这个服务器的 8888 端口，默认 token 是 nebula

cuihangrui · 2023 年2 月 14 日 08:48

第一次跑有三十分钟然后我以为是网络原因手动停止了，然后现在是第二次执行命令有十来分钟了

wey · 2023 年2 月 14 日 08:49

好的，可以稍微等一下，中间有 wget 的过程确实比较让人心慌（卡主）

cuihangrui · 2023 年2 月 14 日 09:49

这个报错是什么原因呢

wey · 2023 年2 月 14 日 09:56

应该是网络原因，你可以看看执行 tree ~/.nebula-up/nebula-up/spark/ 比较一下这里边缺啥，如果 nebula-algo 在的话，可以手动执行 ~/.nebula-up/nebula-start.sh 启动，然后应该就可以继续了，不用重新安装。

tree ~/.nebula-up/nebula-up/spark/
/home/wei.gu/.nebula-up/nebula-up/spark/
├── docker-compose.yaml
├── Dockerfile
├── download
│   ├── nebula-algo.jar
│   ├── nebula-exchange.jar
│   ├── nebula-spark-connector.jar
│   └── soc-LiveJournal1.txt
├── exchange.conf
├── hadoop.env
├── louvain.conf
├── pagerank.conf
├── pagerank_example.ipynb
└── player.csv